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(57) Abstract 

The invention relates to a gene construct containing a biotin gene with the sequence SEQ ID No. I or SEQ ID No. 3, and to organisms 
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(57) Zusammenfassung 

Die Erfindung betrifft ein Genkonstrukt enthaltend ein Biotingen mit der Sequenz SEQ ID No. 1 oder SEQ ID No. 3, Organismen, die 
dieses Genkonstrukt enthalten, die Verwendung dieser Sequenzen oder des Genkonstrukts zur Herstellung von Biotin, sowie ein Verfahren 
zur Herstellung von-Biotin. 
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Verfahren zur Herstellung von Bio tin 
Beschreibung 

Die Erfindung betrifft ein Genkonstrukt enthaltend ein Biotingen 
mit der Sequenz SEQ ID No. 1 Oder SEQ ID No . 3, Organismen, die 
dieses Genkonstrukt enthalten, die verwendung dieser Sequenzen 
Oder des Genkonstrukts zur Herstellung von Biotin, sowie ein 
Verfahren zur Herstellung von Biotin. 

Als Coenzym spielt Biotin (Vitamin H) eine essentielle Rolle bei 
enzymkatalysierten Carboxylierungs- und Decarboxylierungsreaktio- 
nen. Biotin ist damit ein essentieller Faktor in. lebenden Zellen. 
Biotin muB von fast alien Tieren und einigen Mikroorganismen von 
auBen auf genommen werden, da sie Biotin nicht selber synthetisie- 
ren konnen. Es ist damit fur diese Organismen ein essentielles 
Vitamin. Bakterien, Hefen und Pflanzen hingegen konnen Biotin aus 
Vorstufen selbst synthetisieren (Brown et al. Biotechnol. Genet. 
Eng. Rev. 9, 1991: 295 - 326, DeMoll, E . , Escherichia coli and 
Salmonella, eds. Neidhardt, F. C. et al. ASM Press, Washington 
DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5). 

Die Biotinsynthese wurde in bakteriellen Organismen speziell im 
gramnegativen Bakterium Escherichia coli und im gramposi tiven 
Bakterium Bacillus sphaericus untersucht (Brown et al. Bio- 
technol. Genet. Eng. Rev. 9, 1991: 295 - 326). Als erstes bis- 
her bekanntes Intermediat in E. coli wird Pimelyl-CoA (PmCoA) 
angesehen, das aus der Fe ttsauresynthese stammt (DeMoll, E . , 
Escherichia coli and Salmonella, eds. Neidhardt, F. C. et al. ASM 
Press, Washington DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5 
1996). Der Syntheseweg dieser Biotin-Vorstuf e in E. coli ist 
bisher weitgehend unbekannt (Ifuku 1993, Lemoine 1996). Es wurden 
mit bioC uhd bioH zwei Gene identif iziert , deren korrespondie- 
rende Proteine fur die Synthese von Pm-CoA verantwortlich sind. 
Die enzymatische Funktion der Genprodukte BioH und BioC ist 
bisher nicht bekannt (Lemoine et al . , Mol. Microbio. 19, 1996: 
645 - 647, DeMoll, E., Escherichia coli and Salmonella, eds'. 
Neidhardt, F. C. et al . ASM Press, Washington DC, USA, 1996: 704 
- 708, ISBN 1-55581-084-5). Pm-CoA wird in vier weiteren enzy* 
,ma,ti.schen^_Sch,ritten zum B iotin umge wandelt. Ausgehend vom Pm-CoA 
findet zuerst die Kondensation mit Alanin zu 7-Keto-8-Amino- 
Pelargonsaure (KAPA) statt. Das Genprodukt fur diese Umsetzung 
ist BioF (KAPA-Synthetase) . KAPA wird mit dem Kosubstrat S-Adeno- 
syl-Methionin durch BioA (DAPA-Aminotransf erase) zu 7,8 Diamino- 
Pelargonsaure transaminiert . Der nachste Schritt fiihrt nach einer 
ATP-abhangigen Carboxylierungsreaktion zum Dethiobiotin (DTB) und 
wird durch BioD (Dethiobiotin-Synthase ) katalysiert. Im leczten 
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Schritt findet die Umsetzung von DTB zu Biotin statt. Dieser 
Schritt wird durch BioB (Biotin-Synthetase) katalysiert. Die fur 
die beschriebenen Proteine kodierenden Gene bioF, bioA, bioD, und 
bioB sind in E. coli auf einem bidirektionalem Operon kodiert. 

5 Dieses Operon liegt zwischen der X-attachment-si te und dem uvrB 
Gen Locus bei ca. 17 Minuten auf dem E. coli Chromosom {Berlyn et 
al . 1996: 1715 - 1902). Auf diesem Operon sind zusatzlich noch 
zwei weitere Gene kodiert, von denen das eine, bioC, bereits 
beschriebene Funktionen in der Syn these von Pm-CoA hat, wahrend 

3 einem offenen Leseraster hinter bioA bisher keine Funktion zuge- 
ordnet werden konnte (WO94/8023, Otsuka et al., J. Biol. Chem. 
263, 1988: 19577 - 85). Hoch konservierte Homologe zu den E. coli 
Proteinen BioF, A, D, B wurden in B. sphaericus, B. subtilis, 
Syneccocystis sp. (Brown et al. Biotechnol. Genet. Eng. Rev. 9, 

5 1991: 295 - 326, Bower et al . , J. Bacteriol. 175, 1996: 4122 - 

3 4130, Kaneko et al., DNA Res. 3, 3, 1996: 109 - 136), Archae- 
bakterien wie Methanococcus janaschi, Hefen wie Saccharomyces 
cerevisiae (Zhang et al . , Arch. Biochem. Biophys. 309, 1, 1994: 
29 - 35) oder in Pflanzen wie Arabidopsis thaliana (Baldet et 

Q al., C. R. Acad. Sci . Ill, Sci. Vie. 319, 2, 1996: 99 - 106)) 
gef unden . 

Die Synthese von Pm-CoA scheint in den beiden bisher unter- 
suchten gram-positiven Mikroorganismen anders zu verlaufen als 
in E. coli. Es konnten keine Homologen von bioH und bioC ge- 
5 funden werden (Brown et al. Biotechnol. Genet. Eng. Rev. 9, 1991: 
295 - 326) . 

Biotin ist eine optisch aktive Substanz mit drei Chiralitats- 
zentren. Es wird bisher wirtschaf tlich nur iiber eine vielstufige, 
0 teure chemische Synthese hergestellt werden. 

Alternativ zu dieser chemischen Synthese wurde eine Vielzahl 
von Versuchen unternommen, ein f ermentatives Verfahren zur Her- 
stellung von Biotin mit Mikroorganismen aufzubauen. Durch Klonie- 

5 rung des Biotin-Operons auf mul ti-copy-Plasmide konnte die Bio- 
tinsynthese in den mit diesen Genen transf ormierten Mikroorganis- 
men erhdht werden. Eine weitere Erhohung der Biot insynthese wurde 
durch die Deregulierung der Biotingenexpression uber die Selek- 
tion von birA-Mutanten erreicht (Pai C. H., J. Bacteriol. 112, 

0 1972: 1280 - 1287) . Die ^Combination beider Ansatze, das heiBt die 
Expression der Plasmid-kodierten Biosynthesegene in einem regula- 
tionsdef izienten Stamm (EP-B-0 236 429), brachte eine weitere 
Steigerung der Produktivi ta t . Das Biotin-Operon kann dabei ent - 
weder unter Kontrolle seines nativen bidirektionalem Promotors 

5 verbleiben (EP-B-0 236 429), oder seine Gene konnen unter die 
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Kontrolle eines extern regulierbaren Promotors gebracht werden 
(WO94/8023) . 

Durch die bisher verfolgten Ansatze zur f ermentativen Herstellung 
5 von Biotin in E. coli konnte keine wirtschaf tlich ausreichende 
Produktivitat erreicht werden. Es zeigte sich, dafi die Ausbeute 
in der f ermentativen Herstellung von Biotin durch die unvoll- 
standige Umwandlung von DTB zu Biotin durch das BioB-Genprodukt 
(Biotinsynthase) verursacht wird. Zellen die Mutationen im bioB- 
10 Gen tragen, sind nicht in. der Lage auf DTB zu wachsen und damit 
DTB in Biotin umzuwandeln. Der chemische und enzymatische Mecha- 
nismus der Umwandlung von DTB zu Biotin ist bisher nur unvoll- 
standig verstanden und aufgeklart. 



15 
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Durch intensive genetische Untersuchungen konnten bisher keine 
weiteren an der Reaktion beteiligten Proteine identif iziert 
werden. Eine Charakterisierung der Umwandlung von DTB zu Biotin 
wurde bisher ausschliefilich in bakteriellen bzw. pflanzlichen 
Zellextrakten durchgefuhrt (WO94/8023, EP-B-0 449 724, Sanyal 
et al- Arch. Biochem. Biophys., Vol. 326, No. 1, 1996: 48 - 56 
und Biochemistry 33, 1994: 3625 - 3631, Baldet et al . Europ. J. 
Biochem. 217, 1, 1993: 479 - 485, Me jean et al. Biochem. Biophys. 
Res. Commun., Vol. 217, No, 3, 1995: 1231 - 1237, Ohshiro et al... 
Biosci. Biotechnol. Biochem., 58, 9, 1994: 1738 - 1741). 

25 Diese Untersuchungen haben gezeigt, daS niedermolekulare Faktoren 
wie S-Adenosylmethionin, NADPH, Cystein, Thiamin, Fe 2HH , Asparagin, 
Serin, Fruktose 1-6-bisphosphat die Synthese von Biotin stimulie- 
ren (Ohshiro et al., Biosci. Biotechnol. Biochem., 58, 9, 1994: 
1738 - 1741, Birch et al . , J. Biol. Chem. 270, 32, 1995: 19158 - 

30 19165, Ifuk et al., Biosci. Biotechnol. Biochem., 59, 2, 1995: 
185 - 189). Neben diesen niedermolekularen Faktoren wurden 
weitere Proteine identif iziert, die die Synthese von Biotin aus 
DTB in Gegenwart von BioB stimulieren. Dabei handelt es sich urn 
Flavodoxin und Flavodoxin-NADPH-Reduktase (Birch et al., J. Biol. 

35 Chem. 270, 32, 1995: 19158 - 19165, Ifuk et al . , Biosci. Bio- 
technol. Biochem., 59, 2, 1995: 185 - 189, Sanyal et al . , Arch. 
Biochem. Biophys. 326, 1, 1996: 48 - 56). 

Die Biotin- und Liponsauresyn these weisen eine grofie Homologie 
_4.0_au£-.---In.._b_eiden_S^ Syntheses tuf e 

zwischen nicht aktivierte C-Atome ein Schwefel bzw. zwei*~Scfiwe- 
felatome inseriert. Die Synthese von Liponsaure ist bisher nur 
unzureichend charakterisier t (DeMoll, E . , Escherichia coli and 
Salmonella, eds . Neidhardt, F. C. et al. ASM Press, Washington 
45 DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5). Es wurden bisher 
nur zwei notwendige Gene in E. coli identif iziert : lipA und lipB. 
Beide Gene liegen in einem Operon, mit einem bisher nicht charak- 
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terisiertem Open Reading Frame (= ORF) zwischen beiden Genen. Ein 
weiters Gen lplA ist in der Lage Liponsaure uber ein Lipoyl-AMP- 
Intermediat auf Lysin zu ubertragen. Diese Reaktion hat somit 
Ahnlichkeit mit der Aktivitat von birA. Zwischen LipA und BioB 
konnten durch Sequenzvergleiche homologe Bereiche in der Amino - 
sauresequenz identif iziert werden. Diese Umfassen unter anderem 
ein Cystein-Cluster . Es konnte gezeigt werden, daB LipA fur den 
Einbau von zwei Schwef elatomen in die Liponsaure katalysiert 
(DeMoll, E., Escherichia coli and Salmonella, eds . Neidhardt, 
F. C. et al. ASM Press, Washington DC, USA, 1996: 704 - 7.0 8, ISBN 
1-55581-084-5) . 

Uber die Herkunft des Schwef els im Biot inmolekul existieren 
widerspriichliche Ergebnisse. Bei Untersuchungen der Biotinsynt- 
hese in Gesamtzellextrakten wurde gezeigt, daB in Gegenwart von 
35 S-markiertem Cystein Radioaktivi tat in Biotin inkorporiert 
wurde; weder mit 35 S-markiertem Methionin noch mit S-Adenosyl- 
Methionin konnte ein Schwef el-Einbau ins Biot inmolekul nachge- 
wiesen werden (Ifuku et al., Biosci . Biotechnol. Biochem. 59, 2, 
1995: 184 - 189, Birch et al . , J. Biol. Chem.270, 32, 1995: 19158 
- 19165) . 

Im Gegensatz dazu stehen Untersuchungen mit gereinigtem BioB- 
Protein in Gegenwart von 35 S-markier tern Cystein und ohne Zugabe 
von Zellextrakten, bei denen zwar eine Biotin-Syn these aber kein 
Einbau von Radioaktivi tat in das Biot inmolekul beobachtet werden 
konnte (Sanyal et al . , Arch. Biochem. Biophys. 326, 1, 1996: 
48 - 56, Mejean et al., Biochem. Biophys. Res. Commun. 2127, 3, 
1995: 1231 - 1237). Unter diesen Synthesebedingungen ohne Zell- 
extraktzugabe war die gebildete Biotinmenge niedrig und entsprach 
0 maximal ca. 2 Mol Biotin/Mol BioB (Sanyal et al., Arch. Biochem. 
Biophys. 326, 1, 1996: 48 - 56) bzw. 0,1 Mol Biotin/Mol BioB 
(Mejean et al . , Biochem. Biophys. Res. Commun. 2127, 3, 1995: 
1231 - 1237). Nach diesen Untersuchungen kann ein Einbau von 
Schwefel in Biotin erfolgen, ohne das Cystein als Schwef eldonor 
5 verwendet wird. Diese Biotinbildung ohne externe S-Quelle konnte 
durch eine Ubertragung von Schwefel aus dem in BioB nachge- 
wiesenen 2Fe-2S Cluster erklart werden. Die tatsachliche 
Schwef elquelle fur die Biotinsynthese ist nach wie vor unklar. 
Damit konnte bisher in vitro keine echte katalytische Aktivitat 
0 von BioB nachgewiesen werden. 

Trotz dieser Vielzahl von Ansatzen reicht die Ausbeute an Biotin 
durch mikrobielle Fermentation bisher fur eine industrielle 
Produktion nicht aus. 
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Aufgabe der vorliegenden Erfindung war es, ein technisches, 
f ermentatives Verfahren zur Herstellung von Biotin zu entwickeln, 
daB eine moglichst optimale Umwandlung von Dethiobiot in in Biotin 
aufweist und damit eine verbesserte Biot insynthese ermoglicht. 

5 

Diese Aufgabe wurde durch das erf indungsgemaBe Verfahren zur Her- 
stellung von Biotin, dadurch gekennzeichne t , daB man ein Biotin - 
gen mit der Sequenz SEQ ID No. i Oder SEQ ID No. 3 sowie seine 
funktionellen varianten, Analoge oder Derivate in einem proka- 
10 ryontischen oder eukaryontischen Wirtsorganismus , der in der Lage 
ist Biotin zu synthetisieren, exprimiert, diesen zuchtet und das 
synthetisierte Biotin direkt, nach Abtrennung der Biomasse oder 
nach Reinigung des Biot ins verwendet, gelost. 

Die im erf indungsgemaBen Verfahren verwendeten Biotingene mit den 
1 Sequenzen SEQ ID No . 1 bzw. SEQ ID No. 3 werden in der SwissProt- 
Datenbank unter den "Accession" -Nummern AE000364 und D90811 
gefiihrt. Die Sequenz D90811 wird auBerdem von Aiba et al . in DNA . 
Res. 3, 6, 1996: 363 - 377 beschrieben. Bei beiden Sequenzen 
wird in der Datenbank eine Homologie zum NifS-Protein vermerkt . 
Weitere Inf ormationen zu diesen Sequenzen sind der Datenbank bzw. 
der Publikation nicht zu entnehmen. 
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Durch Expression der Sequenzen SEQ ID No. 1 und/oder SEQ ID No . 3 
in einem prokaryontischen oder eukaryontischen Wirtsorganismus 
25 lafit sich die Produktivi tat der Biotinbiosynthese deutlich 

steigern. Durch die Expression der Gene wird die Synthese von 
Biotin aus Dethiobiotin urn mindestens den Faktor 2 gegenuber der 
Kontrolle ohne diese Gene, bevorzugt urn einen Faktor groBer 3, 
gesteigert. Bevorzugt wird die Sequenz SEQ ID No. 1 verwendet. 

30 

Nach Isolierung und Sequenzierung sind die im erf indungsgemaBen 
Verfahren verwendeten Biotingene mit den Nukleotidsequenzen SEQ 
ID No. 1 und SEQ ID No. 3 erhaltlich, die fur die in SEQ ID NO: 2 
und SEQ ID No. 4 angegebenen Aminosauresequenzen oder deren 
35 Allelvariationen kodieren. Unter Allelvarianten sind SEQ ID 

No. 1- Oder SEQ ID No. 3-Varianten zu verstehen, die 40 bis 100 % 
Homologie auf Aminosaureebene, bevorzugt 50 bis 100 %, ganz be- 
sonders bevorzugt 80 bis 100 % aufweisen. Allelvarianten umfassen 
insbesondere funktionelle Varianten, die durch Deletion, Inser- 
-4-Q— ^ynn -Qder— Substi^urion^ v_on„Nuk_le_o_t iden au s der in SEQ ID NO : 1 
oder SEQ ID NO: 3 dargestellten Sequenz erhaltlich sind, wobei 
die enzymatische Aktivitat aber erhalten bleibt. 
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Unter Analoge von SEQ ID NO: 1 oder SEQ ID NO: 3 sind beispiels- 
weise ihre bakteriellen, pilzlichen, pf lanzlichen oder Hefe- 
Homologen, verkurzte Sequenzen, Einzelstrang-DNA oder RNA der 
codierenden und nichtcodierenden DNA-Sequenz zu verstehen. 

Derivate sind beispielsweise Promotorvarianten zu verstehen. Die 
Promotoren, die den angegebenen Nukleotidsequenzen vorgeschalten 
sind, konnen durch ein oder mehrere Nukleotidaus tausche, durch 
Insertion (en) und/ oder Deletion (en) verandert sein, ohne daB aber 
die Funktionalitat bzw. Wirksamkeit der Promotoren beeintrachtigt 
sind, Des weiteren konnen die Promotoren durch Veranderung ihrer 
Sequenz in ihrer Wirksamkeit erhoht oder komplett durch wirk- 
samere Promotoren auch artfremder Organismen ausgetauscht werden. 

Unter Derivaten sind auch Varianten zu verstehen, deren Nukleo- 
tidsequenz im Bereich von -1 bis -30 vor dem Startkodon so 
verandert wurden, daB die Genexpression und/oder die Protei- 
nexpression erhoht wird. Vor teilhaf terweise geschieht dies durch 
eine veranderte Shine-Dalgarno-Sequenz . 

Als prokaryontische Wirtsorganismen des erf indungsgemaBen Ver- 
fahrens kommen prinzipiell alle Biotin synthetisierenden gram- 
negativen oder gram-posi tiven Bakterien in Frage. Als gram- 
negative Bakterien seien beispielhaft Enterobacter iaceae wie die 
5 Gattungen Escherichia, Aerobacter, Enterobacter, Citrobacter, 
Shigella, Klebsiella, Serratia, Erwinia oder Salmonella, Pseudo- 
monadaceae wie die Gattungen Pseudomonas, Xanthomonas, Burkhol - 
deria, Gluconobacter , Nitrosomonas, Nitrobacter, Methanomonas, 
Comamonas, Cellulomonas oder Acetobacter, Azotobacteraceae wie 
die Gattungen Azotobacter, Azomonas, Beijerinckia oder Derxia, 
Neisseriaceae wie die Gattungen Moraxella, Acinetobacter , 
Kingella, Neisseria oder Branhamella, die Rhizobiaceae wie die 
Gattungen Rhizobium oder Agrobacterium oder die gram-negativen 
Gattungen Zymomonas, Chromobacterium oder Flavobacterium, 
genannt. Als gram-positive Bakterien seien beispielhaft die 
Endosporen-bildenden gram-posit iven aeroben oder anaeroben 
Bakterien wie die Gattungen Bacillus, Sporolactobacillus oder 
Clostridium, die coryneformen Bakterien wie die Gattungen 
Arthrobacter , Cellulomonas , Curtobacterium, Corynebacterium, 
Brevibacterium, Microbac ter ium oder Kurthia, die Act inomycetales 
wie die Gattungen Mycobacterium, Rhodococcus, Streptomyces oder 
Nocardia, die Lactobacillaceae wie die Gattungen Lactobacillus 
oder Lactococcus, die gram-posi tiven Kokken wie die Gattungen 
Micrococcus oder Staphylococcus, genannt. 

Bevorzugt werden Bakterien der Gattungen Escherichia, Citro- 
bacter, Serratia, Klebsiella, Salmonella, Pseudomonas, Comamonas, 
Acinetobacter, Azotobacter, Chromobacterium, Bacillus, Clos- 
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tridium, Arthrobacter , Corynebacterium, Brevibacter ium, Lactococ- 
cus, Lactobacillus, Streptomyces, Rhizobium, Agrobac terium oder 
Staphylococcus im erf indungsgemaBen Verfahren verwendet. Beson- 
ders bevorzugt werden Gattungen und Arten wie Escherichia coli, 
5 Citrobacter freundii, Serratia marcescens, Salmonella typhimu- 
rium, Pseudomonas mendocina, Pseudomonas aeruginosa, Pseudomonas 
mutabilis, Pseudomonas chlororaphis, Pseudomonas fiuorescens, 
Comamonas acidovorans, Comamonas testosteroni , Acine tobacter 
calcoaceticus, Azotobacter vinelandii, Chromobacterium violaceum, 
10 Bacillus subtilis, Bacillus sphaericus, Bacillus stearother- 
mophilus, Bacillus pumilus, Bacillus lichenif ormis , Bacillus 
amyloliquef aciens, Bacillus megaterium, Bacillus cereus, Bacillus 
thuringiensis, Arthrobacter citreus, Arthrobacter paraffineus, 
Corynebacterium glutamicum, Corynebacterium primorioxydans , 
Corynebacterium sp., Brevibacter ium ketoglutamicum, Brevibacte- 
rium linens, Brevibacter ium sp . , Streptomyces iividans, Rhizobium 
leguminosarum Oder Agrobacterium tumef aciens. Vorteilhaf terweise 
werden Bakterien verwendet, die schon eine erhohte natiirliche 
Biot inproduktion besitzen. 

20 Die taxonomische Stellung der aufgefiihrten Gattungen unterlag in 
den letzten Jahren einem starken Wandel und befindet sich noch 
immer -im FiuB, da falsche Gattungs- und Artnamen korrigiert wer- 
den. Aufgrund dieser in der Vergangenhei t haufig erf orderlichen 
taxonomischen Umgruppierungen der genannten Gattungen innerhalb 

25 der bakteriellen Systematik sind auch andere als die oben genann-* 
ten Familien, Gattungen und Arten fur das erf indungsgemaBe Ver- 
fahren geeignet. 

Als eukaryontische Wirtsorganismen des erf indungsgemaBen Verfah- 
30 rens kommen prinzipiell alle Biotin synthetisierenden Organismen 
in Frage wie Pilze, Hefen, Pflahzen oder pflanzliche Zellen. Als 
Hefen seien die Gattungen Rhodotorula, Yarrowia, Sporobolomyces, 
Saccharomyces oder Schizosaccharomyces bevorzugt genannt. Beson- 
ders bevorzugt sind die Gattungen und Arten Rhodotorula rubra, 
35 Rhodotorula glutinis, Rhodotorula graminis, Yarrowia lipolytica, 
Sporobolomyces salmonicolor , Sporobolomyces shibatanus oder 
Saccharomyces cerevisiae. 

Als Wirtsorganismus konnen prinzipiell alle Pflanzen verwendet 
_4j)_w,erAen,_ bevorzu gt wer den Pf la.nzen, die in der Tierernahrung oder 
in der humanen Ernahrung eine Rolle spielen wie Mail7 WeiTefu 
Gerste, Roggen, Kartof f eln, Erbsen, Bohnen, Sonnenblumen, Palmen, 
Hirse, Sesam, Kopra oder Raps. Auch Pflanzen wie Arabidopsis 
thaliana oder Lavendula vera sind geeignet. Besonders bevorzugt 
45 werden pflanzliche Zellkulturen, Protoplasten aus Pflanzen oder 
Kaluskul turen. 
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Vorteilhaf terweise werden im erf indungsgemaSen Verfahren Mikroor- 
ganismen wie Bakterien, Pilze, Hefen oder pflanzliche Zellen ver- 
wendet, die in der Lage sind Biotin in das Anzuchtsmedium aus* 
zuscheiden und die gegebenenf alls zusatzlich schon eine erhohte 
5 naturliche Biotinsynthese haben. Vorteilhaf terweise konnen diese 
Organismen noch bezuglich der Regulation ihrer Biotinbiosynthese 
defekt sein, das heifit es findet keine oder nur eine sehr verrin- 
gerte Regulation der Synthese statt. Dieser Regulationsdef ekt hat 
zur Folge, daB diese Organismen schon eine wesentlich hohere 

10 Biotinproduktivitat besitzen. Ein solcher Regulationsdef ekt ist 
beispielsweise von Escherichia coli als birA-Def ektmutanten 
bekannt und sollte vorzugsweise in Form eines durch auflere 
Einfliisse induzierbaren Defektes, beispielsweise temperatu- 
rinduzierbar , in den Zellen vorhanden sein. Es konnen im Prinzip 

15 auch Organismen verwendet werden, die keine naturliche Biotin- 
produktion aufweisen, nachdem sie mit den Biotingenen transfor- 
miert wurden. 

Urn die Biotinproduktivitat insgesamt weiter zu steigern sollten 
die Organismen im erf indungsgemaSen Verfahren vorteilhaf terweise 
zusatzlich mindesten ein wei teres Biotingen ausgewahlt aus der 
Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 
oder bioR enthalten. Dieses zusatzliche Gen oder diese zusatz- 
lichen Gene konnen in ein oder mehreren Kopien in der Zelle vor- 
handen sein. Sie konnen auf dem gleichen Vektor wie die Sequenzen 
25 SEQ ID No. 1 und/oder SEQ ID No . 3 lokalisiert sein oder auf 

getrennten Vektoren oder aber chromosomal integriert worden sein. 
Auch die Sequenzen SEQ ID No. 1 und/oder SEQ ID No . 3 konnen ins 
Genom inser ier t werden . 

30 Unter dem erf indungsgemafien Genkonstrukt sind die Biotingense- 
guenzen SEQ ID No. 1 und SEQ ID No. 3 sowie deren funktionelle 
Varianten, Analoge oder Derivate zu verstehen, die mit einem oder 
mehreren Regulationssignalen zur Erhohung der Genexpression funk- 
tionell verkniipf.t wurden. Zusatzlich zu diesen neuen Regula- 

35 tionssequenzen kann die naturliche Regulation dieser Sequenzen 
vor den eigentlichen S trukturgenen noch vorhanden sein und ge- 
gebenenfalls genetisch verandert worden sein, so daB die natur- 
liche Regulation ausgeschal tet und die Expression der Gene erhoht 
wurde. Das Genkonstrukt kann aber auch einfacher aufgebaut sein, 

40 das heifit es wurden keine zusatzlichen Regula t ionssignale vor die 
Sequenzen SEQ ID No. 1 und/oder SEQ ID No. 3 inser ier t und der 
naturliche Promotor mit seiner Regulation wurde nicht entfernt. 
Stattdessen wurde die naturliche Regulat ionssequenz so mutiert, 
daB keine Regulation durch Biotin mehr erfolgt und die Ge - 

45 nexpression gesteigert wird. Auch am 3 ' -Ende der DNA-Sequenzen 
konnen zusatzliche vorteilhafte regula torische Elemente inseriert 
werden. Die Biotingene mit den Sequenzen SEQ ID No. 1 und/oder 
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SEQ ID No. 3 konnen in einer Oder mehreren Kopien im Genkonstrukt 
enthalten sein. 

Vorteilhafte Regulationssequenzen fur das erf indungsgemaBe Ver- 
5 fahren sind beispielsweise in Promotoren wie cos-, tac-, trp-, 
tet-, trp-tet-, lpp-, lac-, lpp-lac-, lad*-- T7-, T5-, T3-, 
gal-, trc-, ara-, SP6-, X-P R - oder im A.-P L -Promotor enthalten, die 
vorteilhaf terweise in gram-nega tiven Bakterien Anwendung finden. 
Weitere vorteilhafte Regulationssequenzen sind beispielsweise in 
den gram-positiven Promotoren amy und SP02 , in den Hef epromotoren 
ADC1, MFa , AC, P-60, CYC1 , GAPDH oder in den Pf lanzenpromotoren 
CaMV/35S, SSU, OCS, lib4, usp, STLS1 , B33, nos oder im Ubiquitin- 
oder Phaseolin-Promotor enthalten. 



15 



20 



25 



Prinzipiell konnen alle natur lichen Promotoren mit ihren Regula- 
tionssequenzen wie die oben genannten fur das erf indungsgemaBe 
verfahren verwendet werden. Dariiberhinaus konnen auch synthe- 
tische Promotoren vorteilhaft verwendet werden. 

Im Genkonstrukt konnen weitere Biotingene ausgewahlt aus der 
Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, biow, bioX, bioY 
oder bioR in einer oder mehreren Kopien enthalten sein, die einen 
eigenen Promotor haben konnen oder aber unter der Regulation des . 
Promotors der Sequenzen SEQ ID No. 1 oder SEQ ID No. 3 liegen 
konnen. 



• Das Genkonstrukt wird zur Expression in den oben genannten Wirts- 
organismus vorteilhaf terweise in einen wirtsspezif ischen Vektor 
inseriert, der eine optimale Expression der Gene im Wirt ermog- 
licht. Geeignete Vektoren sind beispielsweise in E. coli pLG338, 
30 PACYC184, pBR322, pUC18, pUC19, pKC30, pRep4 , pHSl, pHS2, 

pPLc23 6 , pMBL24, pLG200, pUR290, pIN- 1 II 113 -B1 , A.gtll oder pBdCI, 
in Streptomyces pIJlOl, pIJ364, pIJ702 oder plJ361, in Bacillus 
pUBllb, pC194 oder pBD2'14, in Corynebacter ium pSA77 oder pAJ667, 
in Pilzen pALSl, pIL2 oder pBB116, in Hef en YEp6, YEpl3 oder pEM- 
35 BLYe23 Oder in Pflanzen pLGV23, pGHlac+, pBIN19, pAK2004 oder 
pDHBl. Die genannten Vektoren stellen eine kleine Auswahl der 
moglichen Vektoren dar. Weitere Vektoren sind dem Fachmann wohl 
bekannt und konnen beispielsweise aus dem Buch Cloning Vectors 
(Eds. Pouwels P. H. et al. Elsevier, Amsterdam-New York-Oxford, 
_4_0_i .9_8_5_/_ISBN_ 0 444 90 4018) en tnommen we r den . 



Unter Expressionssysteme sind" die Kombination aus den oben bei - 
spielhaf t genannten Wir tsorganismen und den zu den Organismen 
passenden Vektoren wie Plasmide, viren oder Phagen wie das T7 RNA 
45 Polymerase/Promoter System oder Vektoren mit regulator ischen 
Sequenzen fur den Phagen X zu verstehen. 
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Bevorzugt sind unter dem Begriff Expressionssysteme die Kombina- 
tion aus Escherichia coli und seinen Plasmiden und Phagen und den 
dazugehorenden Promo toren sowie Bacillus und seine Plasmide und 
Promotoren zu verstehen. 

5 

Fur die vorteilhafte erf indungsgemafie Expression der SEQ ID No. 1 
und SEQ ID No. 3 sind aufierdem weitere 3' und/oder 5' Terminale 
regulatorische Sequenzen geeignet . 

10 Diese regulatorischen Sequenzen sollen die gezielte Expression 
der Biotingene und der Proteinexpression ermoglichen. Dies kann 
beispielsweise je nach Wirtsorganismus bedeuten, daB das Gen erst 
nach Induction exprimiert oder iiberexprimier t wird, Oder dafi es 
sofort exprimiert und/oder uberexprimiert wird. 

15 

Die regulatorischen Sequenzen bzw. Faktoren konnen dabei vorzugs- 
weise die Biotingenexpression positiv beeinflussen und dadurch 
erhohen. So kann eine Verstarkung der regulatorischen Elemente 
vorteilhaf terweise auf der Transkript ionsebene erfolgen, indem 
20 starke Transkriptionssignale wie Promotoren und/oder "Enhancer" 
verwendet werden. Daneben ist aber auch eine Verstarkung der 
Translation moglich, indem beispielsweise die Stabilitat der mRNA 
verbessert wird. 

25 Unter "Enhancer" sind beispielsweise DNA-Sequenzen zu verstehen, 
die iiber eine verbesserte Wechselwirkung zwischen RNA- Polymerase 
und DNA eine erhohte Biotingenexpression bewirken. 

Eine Steigerung der von den Sequenzen SEQ ID No. 1 oder SEQ ID 
30 No. 3 abgeleiteten Proteinen und ihrer Enzymakt ivi tat laBt sich 
zum Beispiel gegenuber den Ausgangsenzymen durch Veranderung der 
entsprechenden Gensequenzen oder der Sequenzen seiner Homologen 
durch klassische Mutagenese wie UV-Bestrahlung oder Behandlung 
mit chemischen Mutagentien und/oder durch gezielte Mutagenese wie 
35 site directed mutagenesis, Deletion (en) , Insertion (en) und/oder 
Substitution (en) erzielen. Auch kann eine erhohte Enzymaktivi tat 
neben der beschr iebenen Genamplif ikation durch Ausschaltung von 
Faktoren, die die Enzymbiosynthese reprimieren und/oder durch 
Synthese aktiver statt inaktiver Enzyme erreicht werden. 

40 

Durch das erf indungsgemaBe Verfahren wird die Umwandlung von DTB 
in Biotin und damit die Biotinprodukt ivi tat insgesamt iiber die in 
die Organismen iiber Vektoren und/oder chromosomal klonierten Bio- 
tingene mit den Sequenzen SEQ ID No. 1 oder SEQ ID No. 3 vorteil- 
45 haft gesteigert. 
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Im erf indungsgemaBen Verfahren werden die SEQ ID No. 1 und/oder 
SEQ ID No. 3 enthal tenen Mikroorganismen in einem Medium, das das 
Wachstum dieser Organismen ermoglicht angezuchtet. Dieses Medium 
kann ein synthetisches oder ein natiirliches Medium sein. Je nach 
5 organismus werden dem Fachmann bekannte Medien verwendet. Fur das 
Wachstum der Mikroorganismen enthalten die verwendeten Medien 
eine Kohlenstoff quelle , eine Stickstoff quelle, anorganische Salze 
und gegebenenf alls geringe Mengen an Vitamine und Spurenelemente . 

10 vorteilhafte Kohlenstoff quellen sind beispielsweise Zucker wie 
Mono-, Di- oder Polysaccharide wie Glucose, Fructose, Mannose, 
Xylose, Galactose, Ribose, Sorbose, Ribulose, Lactose, Maltose, 
Saccharose, Raffinose, Starke oder Cellulose, komplexe Zucker- 
quellen wie Melasse, Zuckerphosphate wie Fructose-1 , 6-bis - 

15 phosphat, Zuckeralkohole wie Mannit, Polyole wie Glycerin, 

Alkohole wie Methanol oder Ethanol, Carbonsauren wie Citronen- 
saure, Milchsaure oder Essigsaure, Fette wie Sojaol oder Rapsol, 
Aminosauren wie Glutaminsaure oder Asparaginsaure oder Amino - 
zucker, die auch gleichzeitig als Stickstoff quelle verwendet 

„ werden konnen . 
20 

Vorteilhafte Stickstoff quellen sind organische oder anorganische 
Stickstoff verbindungen oder Materialien, die diese Verbindungen 
enthalten. Beispiele sind Ammoniumsalze wie NH 4 C1 oder (NH 4 ) 2 S0 4 , 
Nitrate, Harnstoff, oder komplexe Sticks toff quellen wie Maisquell- 
25 wasser, Bierhef eautolysat , Soj abohnenmehl , Weizengluten , Hefe- 
extrakt, Fleischextrakt , Caseinhydrolysat , Hefe oder Kartoffel- 
protein, die haufig auch gleichzeitig als Sticks tof f quelle dienen 
konnen . 

30 Beispiele fur anorganische Salze sind die Salze von Calcium, 
Magnesium, Natrium, Mangan, Kalium, Zink, Kupfer und Eisen. 
Als Anion dieser Salze sind besonders das Chlor-, Sulfat- und 
Phosphation zu nennen. Ein wichtiger Faktor zur Steigerung der 
Produktivitat im erf indungsgemaBen Verfahren ist der Zusatz von 

35 p e 2+- oder Fe 3+ -Salzen und/oder Kaliumsalzen zum Produktionsmedium. 

Gegebenenf alls werden dem Nahrmedium weitere Wachs tumsf aktoren 
zugesetzt, wie beispielsweise vitamine oder Wachs tumsf orderer wie 
Riboflavin, Thiamin, Folsaure, Nicotinsaure , Pantothenat oder 
.Pyridoxin, Aminosa uren wie Alanin, Cystein, Asparagin, Asparagin- 
saure, Glutamin, Serin, Methonin oder LysiTiV^^^x^aWerr wie— 
Ci tronensaure, Ameisensaure, Pimelinsaure oder Milchsaure, oder 
Substanzen wie Dithiothrei tol . 

45 Zur Stabilisierung der Vektoren mit den Biotingenen in den Zellen 
konnen gegebenenf alls Antibiotika dem Medium zugesetzt werden. 
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Das Mischungsverhal tnis der genannten Nahrstoffe hangt von der 
Art der Fermentation ab und wird im Einzelfall festgelegt. Die 
Mediumkomponenten konnen alle zu Beginn der Fermentation vorge- 
legt werden, nachdem sie falls erforderlich getrennt s teri-lisiert 
Oder gemeinsam sterilisiert wurden, Oder aber je nach Bedarf 
wahrend der Fermentation nachgegeben werden. 

Die Ziichtungsbedingungen werden so festgelegt, daB die Organismen 
optimal wachsen und daB die bestmoglichen Ausbeuten erreicht wer- 
den. Bevorzugte Zuchtungs tempera turen liegen bei 15 °C bis 40 °C . 
Besonders vorteilhaft sind Temperaturen zwischen 2 5 °C und 37 °C. 
Vorzugsweise wird der pH-Wert in einem Bereich von 3 bis 9 fest- 
gehalten. Besonders vorteilhaft sind pH-Werte zwischen 5 und 8. 
Im allgemeinen ist eine Inkubat ionsdauer von 8 bis 240 Stunden 
bevorzugt von 8 bis 120 Stunden ausreichend. Innerhalb diser Zeit 
reichert sich die maximale Menge an Biotin im Medium an und/oder 
ist nach AufschluB der Zellen verfugbar. 

Das erf indungsgemaBe Verfahren zur Herstellung von Biotin kann 
kontinuierlich Oder batch-weise durchgefiihrt werden. Werden aus 
den mit den Biotingenen transf ormierten Pf lanzenzellen ganze 
Pflanzen regeneriert, so konnen diese nach dem erf indungsgemafien 
Verfahren ganz normal angeziichtet und vermehrt werden. 

Beispiele: 

Ausgehend von der Uberlegung, daB an der Umsetzung von DTB zu 
Biotin auBer BioB und den bekannten weiteren Kofaktoren mogli- 
cherweise ein Fe-S-Cluster-regenerierendes Enzym beteiligt sein 
konnte, wurde der Versuch unternommen ein solches hypote tisches 
Gen zu identif izieren und zu klonieren. 

NifS-Gene sind in der Lage Schwef elatome in einem Fe-S-Cluster 
von Proteinen, die an der Sticks toff fixierung beteiligt sind, zu 
regenerieren (Zheng et al., Proc. Natl. Acad. Sci . USA 90, 1993: 
2754 - 2758 und Biochemistry 33, 1994: 4714 - 4720). Durch Ver- 
gleich aller bekannten Proteine der NifS-Klasse in den Datenban- 
ken. Swiss-Prot und PIR mit dem Programmpake t Lasergene (DNA-Star 
Inc.) unter dem Megalign Modus, konnte ein streng konservier ter 
Bereich dieser Proteine mit der Aminosauresequenz HK(I,L)xGPxG 
(x entspricht Aminosauren mit geringer bzw. nicht erhaltener Kon- 
servierung) identif iziert werden. Die Tatsache der volls tandigen 
Konservierung dieser Sequenz deutet auf eine wichtige Rolle 
dieser Aminosauren (- As) in der Funktion dieser Proteinen hin. 
Diese konservierten Aminosauren werden im .folgenden als Motiv I 
bezeichnet . 
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Das derart beschriebene As-Motiv diente als Vergleichsequenz fur 
eine weitere Analyse der Datenbank Swiss-Prot/PIR Release 93 bzw. 
94 nach Proteinen bzw. ORF's (= open reading frame) zu suchen, 
in denen diese Nif S-Funkt ionssequenz vollstandig konserviert ist. 
5 Als Programm fur die Sequenzanalyse wurde das Programm Geneman 
des Pakets DNA-Star eingesetzt. Die Analyseparame ter wurden wie 
folgt fixiert: Menue "consensus sequence" mit einer 80% Konser- 
vierung des Motivs. 

10 Als Ergebnis dieser Recherche wurde gefunden, daB neben bereits 
als Nif S-homolge Proteine identif izierte Proteine weitere 
Proteine/ bzw. ORF's existieren, die dieses Sequenzmotiv auf - 
weisen. Unter den in der Datenbank enthaltenen weiteren Sequenzen 
konnte ein offenes Leseraster aus E. coli mit signif ikanter 

15 Konservierung der Konsensus-Sequenz identif iziert werden, das wie 
die eigenen Arbeiten zeigten an der Biotinsynthese beteiligt ist. 
Dieses offene Leseraster mit der Bezeichnung ECU29581_24 (= SEQ 
ID No. 1 = ORF401) kodiert fur ein hypothetisches von dieser 
Sequenz abgeleitetes Protein von 401 As. Es zeigte sich, daB 
diese Sequenz im Rahmen der E. coli Genomsequenzierung durch 

20 F. Blattner und Mitarbeitern sequenziert worden war (DNA-Research 
1996), ohne daB dessen Funktion erkannt worden war. Diese Sequenz 
(SEQ ID No. 1) wird im Nachf olgenden als BioSl bezeichnet. 

Vergleicht man die Proteinsequenz von BioSl mit der von NifS aus 
25 A. vinelandii (Programm: DNA-S tar -"Mega 1 ign" im Modus: paarweises 
Alignement nach Lipman-Pearson, Analyseparame ter : k-tuple 2, 
gap-penalty 4, gap-length-penalty 12) zeigt sich, dafi ECU29581_24 
auch in anderen Bereichen der Sequenz uber einen Sequenzbereich 
von 218 As eine Homologie von 27,6% zu NifS aus A. vinelandii 
30 aufweist. Gegenuber dem als NifS identif iziertem Protein aus 
Rhodococcus capsulatus betragt die Homologie 25,3 % uber einen 
Bereich von 376 As. 

In der Datenbank Swiss-Prot/PIR konnten weitere Sequenzen identi- 
35 fiziert werden, die Homologien zu ECU29581__24 aufweisen (Programm 
Geneman/ Modus sequence similarity; Eins tellungen default) . Die 
hochste gefundene Sequenzahnlichkei t zu ECU29581_24 zeigt ein 
translatierter ORF (= open reading frame) aus H . influenza (Da- 
tenbankbezeichnung HIU00082_62) . Zwischen BioSl und HIU00082_62 
40, _wur_de_eine Seq uenzhom o lgie von 45,5% uber die gesamte Lange bei- 
der Proteine gefunden. Die Sequenzahnlichkei t bzw. die Homologie" 
beider Proteine ist damit signifikant hoher, als zwischen 
ECU29581_24 (= BioSl) und NifS aus R. capsulatus bzw. A. vine- 
landii. Es handelt sich damit vermutlich urn das H. influenza 
45 Homologe zu BioSl. 
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Von Fleischmann et al. (Science. 269, 1995: 496-512) war neben 
dem ORF HIU00082_62 ein weiterer ORF (HIU00072_10) in H. influ- 
enza aufgrund seiner Sequenzahnlichkei t zu NifS gefunden worden. 

5 Aufgrund dieser Beschreibung von Fleischmann et al. wurde ge- 
folgert, daB neben" bioSl auch in E. coli noch ein weiteres NifS- 
ahnliches Gen existiert. Dieses hypothe tische Gen wurde bioS2 
genannt . 

10 1- Konstruktion der Vektoren pHSlund pHS2: 

Die Plasmide pHSl und pHS2 bestehen aus verschiedenen sog . 
Kassetten, die einen Replikat ionsursprung , eine Resistenzkas - 
sette, einen Promotor, eine Klonierungsstelle, und Terminatoren 
15 tragen. Die Plasmide wurden aus unterschiedlichen DNA- Fragment en 
zusammengesetzt . Die dafiir notwendigen DNA-Fragmente wurden durch 
PCR-Reaktionen mit unterschiedlichen Plasmiden als Matrizen her- 
gestell t . 



20 



25 



30 



a.) Herstellung der Kassette mit einem Replika tionsursprung : 

Urn den Repl ikat ionsursprung aus einem P15A-Replikon-enthal tenden 
Plasmid als klonierbare Kassette berei tzustellen, wurde durch 
eine PCR Reaktion mit dem Plasmid pRep4 (Quiagen) mit den Oligo- 
nukleotiden P15A,1 ( 5 ' -GGCCCCTAGGGGATATATTCCGCTTCCTCGC-3 ' ) und 
P15A,2 ( 5' -GGCCACTAGTAACAACTTATATCGTATGGGG-3 ' ) ein DNA-Fragment 
von 919 Basen Lange aus dem Plasmid isoliert. Das Fragment wurde 
mit den Res triktionsenzymen Avrll und"SpeI in einem geeigneten 
Puffer geschni tten . 

PCR-Bedingungen: 



Es wurden 2,5 U Taq-Polymerase sowie 15 pMol der Oligonukleotide 
in 100 ul Ansatzlosung zur Isolierung der Replikat ionskassette 
aus dem Plasmid pRep4 verwendet. Die Oligonukleotide wurden bei 
35 50 °C angelagert. Die Elongation erfolgte bei 72 °C fur 1 min. 
iiber 30 Zyklen . 

b.) Herstellung der Kanamyzin-Resistenzkassette: 

40 urn eine Kanamyzin-Resistenzkassette als klonierbare Kassette 
bereitzustellen wurde durch eine PCR Reaktion aus einem die 
Kanmyzin-Resistenzkassette enthal tenden Plasmid (pRep4, Quiagen) 
mit den Oligonukleotiden Kan-R,l ( 5 ' -GGCCGAGCTCTCGAACCCCA - 
GAGTCCCGCT-3' ) und Kan-R,2 (5 ' -GGCCGACGTCGGAATTGCCAGCTGGGGCGC-3 ' ) 

45 ein DNA-Fragment von 952 Basen Lange isoliert. Das Fragment wurde 
mit Aatll und SacI in einem geeigneten Puffer geschnitten. 
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PCR-Bedingungen : 

Es wurden 2,5 U Taq-Polymerase sowie 15 pMol der Oligonukleotide 
in 100 |al Ansatzlosung zur Isolierung der Kanamyzin-Resistenz - 
kassette aus dem Plasmid pRep4 verwendet. Die Oligonukleotide 
wurden bei 50 °C angelagert. Die Elongation erfolgte bei 72 °C fur 
1 min. uber 30 Zyklen. 

c. ) Herstellung der Terminat ionsbereiche : 

* Urn den Terminator TO aus dem Phagen Lambda als klonierbare 
Kassette berei tzustellen wurde durch eine PCR Reaktion mit 
dem Plasmid pDS12-luzi (Schroder H . et ai., EMBO Journal. 12, 
11, 1993: 4137 - 4144) als Matrize mit den 01 igonukleot iden 
TO , 1 ( 5 ' -GGCCGAGCTCGCTTGGACTCCTGTTGATAG-3 ' ) und TO , 2 

( 5 ' -GGCCACTAGTGCTTGGATTCTCACCAATAAAAAACGCCC-3 ' ) ein DNA-Frag - 
ment von 120 Basen Lange isoliert. Das Fragment wurde durch 
die Enzyme Spel und SacI in einem geeigneten Puffer ge - 
schni tten . 

Matrize fur TO: pDS12-luzi 

Es wurden 2,5 U Taq-Polymerase sowie 15 pMol der 01 igonukleo -__ 
tide in 100 fil Ansatzlosung zur Isolierung des Terminations- . 
bereiches aus dem Plasmid pDS12-luzi verwendet. Die Oligo- 
nukleotide wurden bei 50 °C angelagert. Die Elongation er- 
folgte bei 72 °C fur 0,5 min. uber 30 Zyklen. Anschliefiend 
wurde ein 120 bp groBes Fragment isoliert und auf gereinig t . 
Dieses wurde mit je 20 U Spel und SacI verdaut. 

* Urn den Terminator Tl aus dem rrnB-Operon als klonierbare 
Kassette bereitzustellen, wurde durch eine PCR Reaktion mit 
dern Plasmid pDS12-luzi (Schroder et al . siehe oben) als 
Matrize und mit Hilfe der Oligonukleotide Tl, 1 ( 5 ' -GGCCCCTAG - 
GTCTAGGGCGGCGGATTTGTCC - 3 ' ) und Tl , 2 ( 5 ' -GGCCTCTAGAGGCATCAAA - 
TAAAACGAAAGGC-3 ' ) ein DNA-Fragment von 120 bp Lange isoliert. 
Das Fragment wurde durch die Enzyme Xbal und Avrll in einem 
geeigneten Puffer geschnitten. 

Matrize fur Tl: pDS12-luzi 



Es wurden 2,5 U Taq-Polymerase sowie 15 pMol der Oligonukleo 
tide in 100 (al Ansatzlosung zur Isolierung des Terminations - 
bereiches aus dem Plasmid pDS12-luzi verwendet. Die Oligo- 
nukleotide wurden bei 50 °C angelagert. Die Elongation er- 
folgte bei 72 °C fur 0,5 min. uber 30 Zyklen. Anschliefiend 
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wurde ein 120 bp groBes Fragment isoliert und auf gereinigt . 
Dieses wurde mit je 20 U Xbal und Avrll verdaut. 

d. ) Herstellung der Promotoren fur pHSl und pHS2 : 
Die Oligonukleotide PPHS1,1 

(5 ' -TCGAGATAGCATTTTTATCCATAAGATTAGCCGATCCTAAGGTTTACAATTGTGAGCGCTC 
ACAATTATGATAGATTCAATTGTGAGCGGATAACAATTTCACACACGCTAGCGGTAC- 3 ' ). und 
PPHS1, 2 

(5 ' -CGCTAGCGTGTGTGAAATTGTTATCCGCTCACAATTGAATCTATCATAATTGTGAGCGCTC 
ACAATTGTAAACCTTAGGATCGGCTAATCTTATGGATAAAAATGCTATC- 3 ' ) bzw. 
PPHS2 , 1 

( 5 ' - AATTCTCCCTATCAGTGATAGAGATTGACATCCCTATCAGTGATAGAGATACTGAGACATC 
ACCAGGACGCACTGACCG-3 ' 9 und 
PPHS2", 2 

( 5 ' -AATTCGGTCAGTGCGTCCTGGTGATGTCTCAGTATCTCTATCACTGATAGGGATGTCAATC 
TCTATCACTGATAGGGAGG- 3 ' ) wurden durch chemische Synthese herge- 
stellt. Die Oligonukleotide PPHS1,1 und PPHS1,2 sowie PPHS2,1 und 
PPHS2,2 wurden jeweils in einer Konzentration von l\j.q/\xl ver- 
mischt, 5 min bei 95 °C inkubiert und dann langsam abgekiihlt. Die 
aneinandergelagerten Oligonukleotide wurden in einer Konzentra- 
tion von 10 ng/^1 in der Ligation eingesetzt. Die Oligonucleotide 
PPHS1,1 und PPHS1,2 bildeten den Promotor fur das Plasmid pHSl 
und die Oligonucleotide PPHS2 , 1 und PPHS2,2 den fur das Plasmid 
pHS2 . 

e. ) Herstellung der Klonierungsstelle : 

Zur Konstruktion der Klonierungsstelle wurden die beiden Oligonu- 
kleotide PMCS1, 1 

( 5 ' -GTACCGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCCTGCAGCC 
CGGGGGATCCCATGGTA-3 ' ) und PMC SI , 2 

( 5 ' - ACGCGTACCATGGGATCCCCCGGGCTGCAGGAATTCGATATCAAGCTTATCGATACCGTCG 
ACCTCGAGGGGGGGCCCGGTACC-3 ' ) syn thet isier t . Die beiden Oligonu- 
kleotide wurden in einer Konzentration von l[xg/\xl vermischt, 5 min 
bei 9 5 °C inkubiert und dann langsam abgekuhlt. Die aneinander- 
gelagerten Oligonukleotide wurden in einer Konzentration von 
10 ng/(il in der Ligation eingesetzt. 

f. ) Klonierungsablauf von pHSl und pHS2 

Ausgehend von pDS12 luci wurde die ampR-Kassette des Plasmides 
durch einen Sacl/Aat II-Verdau herausgeschni tten und durch ein 
entsprechendes Sacl/Aatll-Fragment ersetzt, das die Kanamyzin- 
Resitenzkassette enthalt. Nach Transformation und Isolierung 
positiver Klone wurde der erhaltene Vektor ■ Spel/SacI verdaut und 
der durch PCR-amplif iz ierte Terminator TO als Spel/Sacl-Fragment 
stromabwarts der Kanamyz in-Resistenzkasset te eingesetzt. Nach 
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Transformation und Isolierung positiver Klone wurde der erhaltene 
Vektor wurde rr.it Xbal/AvrXI verdaut und der durch PCR-ampli- 
fizierte Terminator Tl als Xbal/Avrll-Fragment eingesetzt. Der 
erhaltene Vektor wurde mit XhoI/EcoRI verdaut und mit den jeweils 
5 aneinandergelagerten Promotoroligonukleotiden (PPHS1,1 und 

PPHS1,2 bzw. PPHS2,1 und PPHS2,2) ligiert. Der entstandene Vektor 
wurde Xbal verdaut und mit Hilfe von Klenow-Fragment aufgefiillt, 
dann Kpnl verdaut und die Vektorbande ohne das Luzif erase-Frag - 
ment isoliert. Zwei weitere aneinandergelagerte Oligonukleot ide 
(PMCS1,1 PMCS1,2), die die Klonierungsstel ie enthalten, wurden 
mit den so verdauten Vektoren ligiert. 

2. Klonierung von bioSl (ECU29581_24 , SEQ ID No. 1): 

15 Das Gen, das fur BioSl kodiert, wurde aus dem Chromosom von 
E. coli durch eine PCR-Reaktion amplif iziert , mit otimierten 
Translationssignalen versehen und in einen Vektor kloniert, der 
eine Uberexpression des Gens in E. coli Stammen ermoglicht. 



10 



20 



25 



a.) Entwicklung von Oligonukleotiden zur Amplif izierung des bioSl 
Gens aus dem E. coli Chromosom: 

BioSl soli als Expressionskassette bestehend aus einer ribosoma- 
len Bindungstelle, dem Startkodon der kodierenden Sequenz und dem 
Stopkodon zwischen zwei Erkennungstellen fur Restr iktionsenzyme 
amplifiziert werden. Fur beide Res triktionsschni ttstellen wurde 
die Erkennungssequenz von Mlul gewahlt. Das bioSl Gen wurde mit 
Hilfe der Oligonucleotide PbioSl, 1 { 5 ' -CGCACGCGTGAGGAGTACCAT - 
GAACGT-3 ' ) und PbioSl , 2 ( 5 ' -CGCACGCGTTTAATCCACCAATAATT-3 ' ) 
kloniert . 

Durchfuhrung der PCR: 

Bedingungen: 

35 Als Matrize wurden 0,5|ng chromosomale DNA von E. coli W3110 ver- 
wendet. Die 01 igonukleotide PbioSl,! und PbioSl, 2 wurden in einer 
Konzentration von je 15 pMol eingesetzt. Die Konzentra tion an 
dNTP's betrug 200 |JM . Als Polymerase wurden 2,5 U Pwo DNA-Poly- 
merase (Boehringer Mannheim) im Reaktionspuf f er des Herstellers 
_e ingeset jl. ^as Vo lumen der PCR-Reaktion betrug lOO^il. 



30 



Amplif ikationsbedingungen: 

Die Denaturierung der DNA erfolgte fur 2 min bei 94 °C . Anschlie- 
45 send wurden die Oligonukleotide fur 30 sec bei 55 °C angelagert. 
Die Elongation erfolgte fur 45 sec bei 72 °C . Die PCR-Reaktion 
wurde viber 30 Zyklen durchgef iihr t . 
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Das erhaltene DNA-Produkt mit einer GroBe von 1200 bp wurde auf- 
gereinigt und durch Mlul im geeigneten Puffer verdaut. 

5ng des Vektors pHSl wurden duch Mlul verdaut und durch Shrimp 
Alkalische Phosphatase (SAP) (Boehringer Mannheim) dephosphoryl - 
liert. Nach Denaturierung der SAP wurden Vektor und Fragment in 
einem molaren Verhaltnis von 1:3 durch den Rapid-DNA-Ligation Kit 
nach der Vorschrift des Herstellers ligiert. Die Transformation 
des Ligationsansatzes erfogte in den Stamm E. coli XL-l-blue. 
Positive Klone wurden durch Plasmidprapara tion und Res triktions - 
analyse identif iziert . Die richtige Orientierung des bioSl-Frag- 
ments in pHSl wurde durch Restr iktionsverdau und Sequenzierung 
bestimmt. Das erhaltene Konstrukt wurde pHSl bioSl (Figur 1) ge- 
nannt. Die Sequenz von pHSl bioSl ist SEQ ID No. 5 zu entnehmen. 
Die abgeleitete Aminosauresequenz von bioSl im Vektor ist SEQ ID 
No. 6 zu entnehmen. 2 ng des Vektors pHSl bioSl wurden mit Mlul 
verdaut und das Gen bioSl durch ein Agarosegel isoliert. Der Vek- 
tor pHS2 wurde mit Mlul verdaut mit SAP-Phospahtase dephosphoryl - 
liert und mit dem Fragment bioSl zusammen in einer Ligation ange- 
setzt. Der Ligationsansatz wurde in XLl-blue transf ormiert und 
positive Klone in der richtigen Orientierung durch Plasmidisolie - 
rung und Res tikt ionsverdau identif iziert . Der erhaltenen Vektor 
wurde pHS2 bioSl (Figur 2) genannt. Die Sequenz von pHS2 bioSl 
ist SEQ ID No. 9 zu entnehmen. Die abgeleitete Aminosauresequenz 
von bioSl im Vektor ist SEQ ID No. 10 zu entnehmen. 

3. Klonierung von bioS2 (SEQ ID No. 3): 

Urn in E . coli weitere Gene zu klonieren, die fur Genprodukte 
kodieren die am Aufbau von Fe-S-Clustern beteiligt sind, wurde 
folgender Weg beschritten: 

Ein Sequenzvergleich (Programm Megalingn, Modus Clustal) von As- 
Sequenzen von Proteinen der Datenbank Swissprot/PIR mit einer 
hohen Homologie <>40%) zum NifS Protein aus A. vinelandii zeigte, 
5 daB neben dem bereits beschriebenen Sequenzmotiv I auch der N- 
Terminus dieser Proteine eine signifikante Konservierung zeigt. 
Als eine typische N-terminale konservierte Sequenz von Proteinen 
der NifS-Familie wurde die As-Sequenz mit der Sequenz MI YLDNXATT 
identif iziert und als Motiy II a bezeichnet. 

0 

Eine Analyse der Datenbank Swissprot/PIR auf eine Konservierung 
dieser Sequenz mit mehr als 80% zeigte ein weiteres Protein in 
E. coli. Von diesem Protein ist durch Edman-Abbau erhaltene 
N-terminale Sequenz von 11 As bekannt (Datenbankbezeichnung : 
5 UP06_Ecoli) . Dieses Protein wurde als hypothetisches NifS-Homolog 
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angesehen und in Analogie zu BioSl als im folgenen als BioS2 

Urn das Gen fur das Protein BioS2 zu klonieren und zu sequenz ie- 
5 ren, wurde folgender Weg beschritten. Ausgehend von der Protein - 
sequenz HIU00072_10 wurde zum einen das konservierte Aminosaure- 
Motiv I zum anderen die oben genannte As-Sequenz von UP06_Ecoli 
benutzt, um degenerierte Oligonukleotide herzustellen, die in der 
Lage sind, ein Fragment des bioS2 Gens zu amplif izieren . Dafiir 
10 wurden die beiden As-Motive HIU00072_10 (Motiv I) und UP06_Ecoli 
(Motiv II b, MKLPIYLDYSAT) in die korrespondierenden DNA-Sequen- 
zen revers translatiert . Aus dem Motiv II wurde so das degene- 
rierte Oligonukleotid PbioS2,l ( 5 ' - ATGAARYTNCCNATHTAYYTNGAY - 
TAYWSNGCNAC-3' ) und aus dem Motiv I das degenerierte Oligonukleo- 
tid PbioS2,2 <5' -cccaghggrccrtgcagyttrtgrccrga-3' ) synthetisier t . 



15 



20 
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Durchfuhrung der PCR-Reaktion : 

Als Matrize diente chromosomale DMA von E. coli W3110. Je 0,5 |J.g 
der Oligonukleotide Pbio2 , 1 und PbioS2,2 wurden mit je 15 pMol 
Nukleotidmix, 2,5 U Pwo DNA-Polymerase (Boehringer Mannheim) im 
Reaktionspuf f er des Herstellers umgesetzt. Das Volumen der PCR- 
Reaktion betrug lOOp.1. 

Ampl if ikat ionsbedingungen : 



Die Denaturierung erfolgte fur 2 min bei 94 °C. Die Anlagerung der 
Oligonukleotide wurde bei 45 °C, die Elongation fur 45 sec bei 
72 °C durchgef uhrt . Die PCR wurde iiber 30 Zyklen durchgef iihrt . 
Durch die PCR konnten drei Fragmente selektiv amplif iziert wer- 

30 den, von denen eines die aus den Sequenzvergleichen erwartete 
Grofie von 600 bp hatte. Dieses DNA-Fragment wurde durch Agarose- 
gel-Auf reinigung isoliert und mit dem Oligonukleotid PbioS2,2 
sequenz iert. Die erhaltene DNA-Sequenz wurde in alien sechs mog- 
lichen Leserastern translatiert. Die erhaltenen translat ierten 

35 As-Sequenzen wurden dann mit der translatierten AS-Sequenz von 
HIU00072_10 bzw. NifS aus A. vinelandii verglichen. Eines der 
translatierten Leseraster zeigt eine hohe Homologie mit der 
As-Sequenz des beschr iebenen ORF HIU00072_10 und mit bioS2 
bezeichnet . 

40 



Um die gesamte DNA-Sequenz von bioS2 (= SEQ" ID~No— 3i~ z-u— be 
stimmen und zu klonieren, wurde folgender Weg beschritten: 

Zuerst wurde eine markierten DNA-Sonde hergestellt, die zu bioS2 
45 homolog ist. Dies geschah mit Hilfe des PCR-DIG-Labelling-Ki t 
(Boehringer Mannheim) . Als Matrize fur die Herstellung der DIG- 
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DNA-Sonde diente das beschriebene PCR-Produkt, das durch die 
Oligonukleotide PbioS2,l und PbioS2,2 hergestellt wurde. 

Die Bedingungen der PCR waren; 

Einsatz: der PCR-Matrize, 5|al Nukleot id-DIG-dUTP-Mix, je 

15 pMol Oligonukleotid PbioS2,l und PbioS2,2, Puffer des Kits mit 
1,75 mM MgCl 2 0,75 |al Expand-Polymerase-Mix (Boehringer Mannheim). 

Ampl i f ikat ionsbedingungen : 

Auf schmelzen der DNA bei 94 °C fur 2 min, Auf schmelzen der DNA 
10 sec bei 94 °C, Annealing 30 sec bei 45 °C, Elongation 3.30 min 
bei 68 °C iiber 10 Zyklen, Auf schmelzen der DNA 10 sec bei 94 °C, 
Annealing 30 sec bei 45 °C, Elongation 3.30 min bei 68 °C, Ver- 
langerung der Elongation fur 20 sec pro Zyklus uber 20 Zyklen. 
Aufreinigung des DIG-markierten Frgaments durch PCR-Purif ica tion 
Kit. 

4. Southern-Analyse von bioS2 mit chromosomaler DNA 

In weiteren Schritten wurde genomische DNA durch Restriktions - 
enzyme verdaut und durch Southern-Hybridisierung mit Hilfe der 
markierten DNA-Sonde analysiert. 

Chromosomale E. coli DNA W3110 (10|ag) wurde mit den folgenden 
Restriktionsenzymen vollstandig verdaut EcoRI , BamHl, Acc65I, 
Hindlll, Sail. Das Volumen der Ansatze betrug 50 \xl, die Enzym- 
menge je 30 U. Die Ansatze wurden 4h inkubiert. Die derart ver- 
daute DNA wurden durch ein 1% Agarosegel in TBE-Puffer (Sambrook, 
J. Fritsch, E F. Maniatis, T . 2nd ed. Cold Spring Harbor 
Laboratory Press. , 1989, ISBN 0-87969-373-8) aufgetrennt und 
mit Hilfe einer Druckubertragungskammer (Stratagene) auf eine 
Nylon-Membran (Boehrineger Mannheim) ubertragen und durch UV- 
Bestrahlung (S tratalinker , Stratagene) kovalent an der Membran 
5 fixiert. Die Hybridisierung erfolgte mit der DIG-markierten DNA- 
Sonde in DIG-Easyhyb Puffer (Boehringer Mannheim) bei 65 °C fur 15 
h. Die Entwicklung des Blots nach Anweisungen des Hersteller 
zeigt Hybridisierung der BioS2-DIG-DNA- Sonde mit Banden, die mit 
GroBen von ca. 3 - 4 kb im Fall von Acc65I, EcoRI und Hindu 
0 bestimmt wurden. BamHl verdaute DNA zeigte eine Hybridisierung 
mit der bioS2-Sonde mit einem Fragment eines wesentlich hoheren 
Molekulargewichts . Zur weiteren Klonierung wurden Fragmente von 
3 - 4 kb bevorzugt weiter bearbeitet. 
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Klonierung von bioS2 durch inverse PCR 

Im Fall des EcoRI-Verdaus wurde ein Fragment von ca. 4 kb identi- 
fiziert, das das gesuchte Gen tragt. Das gesamte Gen wurde dann 

5 durch die Technik der inversen PCR amplifiziert und kloniert. Im 
ersten Schritt der inversen PCR wurde chromosomale E. coli DNA 
durch EcoRI vollstandig verdaut. Im zweiten Schritt wurde dann 
die EcoRI verdaute DNA bei geringen DNA-Konzentrationen (ca.20 
ng/ml) aus dem vorher beschriebenen Restriktionsverdau durch Li- 

0 gase kovalent ligiert, unter Bedingungen unter denen statistisch 
gesehen eine intramolekulare Verknupfung erfolgt. Im dritten 
Schritt wurde dann eine PCR-Reaktion durchgef vihrt , bei der Oligo- 
nukleotide eingesetzt werden, deren Sequenz spezifisch fur das 
gesuchte Zielgen ist. 

5 

Spezifisch amplif izierte DNA-Segemente konnen anhand ihrer Gr66e 
identif iziert werden, die sich aus der GroBe des Res tr iktions - 
fragments aus der Southern-Analyse und aus der Lokalisierung der 
Oligonukleotide im bekannten Abschnitt des Gens ergibt. Derart 
identif izierte Fragmente werden dann in einen geeigneten Vektor 
° wie pBS SK Blueskript/ pCR Script (Stratagene) kloniert und 
sequenzier t . 

Experimentelle Durchf uhrung : 

5 l|ig chromosomale DNA aus dem Stamm W3110 wurde durch 15 U EcoRI _ 
(Boehringer Mannheim) in einem Volumen von 50 |il vollstandig ver- 
daut. Die Vollstandigkeit des Verdaus wurde durch Auftrag von 
30 |il auf ein Agarosegel iiberpruf t. Fragmente dieses Verdaus 
chromosomaler DNA (10 ^1 des Verdaus = 2 00 ng) wurden in einem 

0 Volumen von 100 fil zusammen mit 10 ^il Ligat ionspuf f er und 

2 U T4-Ligase (Boehringer Mannheim) fur 15h bei 15 °Q inkubiert. 
(intramolekulare Ligationsreaktion) . Nach der Ligationsreaktion 
wurde die T4-Ligase durch Inkubation bei 6 5 °C fur 2 0 min. 
inaktiviert Von diesem Ligationsansa tz wurden 5 \il als Matrize 

5 fur eine PCR-Reaktion eingesetzt. Die Primer PbioS2,3 

( 5 ' -GCGTGGGTAAACTGCCTATCGACCTGAGCC-3 ' ) und PbioS2 ,4 ( 5 ' -CTACGCTT - 
CCTTCAGCCTGCCAGCCGAAA- 3 ' ) wurden ausgehend von der Sequenz von 
bioS2 synthetisiert , 

O^Qliaon ukleotid PbioS2 / 3 hybridisiert auf der 5'-Seite von bioS2 
und bewirkt das die Elongation der Amp 1 i f iirarri6n~der~kbd T er enden~ 
Sequenz auf der 5'-Seite auf dem Gegenstrang in 3'-Richtung 
stattf indet . 
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Oligonukleotid PbioS2,4 hybridisiert auf der 3'-Seite von bioS2 
und bewirkt das die Elongation der Amplif ikation der kodierenden 
Sequenz auf der 3'-Seite auf dem kodierenden Strang in 3' -Rich - 
tung stattfindet. 

Einsatz: 5(il des Ligationsansatz , 1,75 nl Desoxynukleot id-Mischung 
(350 ^imol, Boehringer Mannheim), je 15 pMol Oligonukleotid 
PbioS2,5 und PbioS2,6, Puffer Ides Kits mit 1,75 mM MgCl 2 0, 75 ^1 
Expand-Polymerase-Mix . 

Bedingungen fur die Amplif ikation der ligierten E. coli DNA mit 
Primer PbioS2,3/ PbioS2,4. Expand-Kit (Boehringer Mannheim) Auf- 
schmelzen der DNA 2 min bei 94 °C, Auf schmelzen der DNA 10 sec bei 
94 °C, Annealing 30 sec bei 61 °C, Elongation 3.30 min bei 68 °C 
uber 10 Zyklen, Aufschmelzen der DNA 10 sec bei 94 °C, Annealing 
30 sec bei 61 °C, Elongation 3.30 min bei 68 °C, Verlangerung der 
Elongation fur 20 sec pro Zyklus uber 20 Zyklen. 

Durch die beschriebene Amplif ikation wurde ein PCR-Produkt von 
ca. 3 kb erhalten. Dieses DNA-Fragment zeigte in einer Southern- 
Hybridisierung unter stringenten Bedingungen eine deutliche 
Hybridisierung mit der bereits beschriebenen bioS2-DIG-DNA-Sonde. 

Es wurde angenommen, daB dieses DNA-Fragment DNA-Sequenzen ent- 
halt, die zu bioS2 hochgradig homolog sind. Daher wurde dieses 
DNA-Fragment in einen Vektor kloniert, urn es weiter zu charakte- 
risieren und zu sequenzieren . Das DNA-Fragment wurde mit dem pCR- 
Skript Kit (Stratagene) zuerst laut Anweisung des Herstellers 
mit Pf u-Polymerase behandelt und dann in den Vektor pCR Skript 
ligiert. Der Ligationsansatz wurde in XL-l-blue Zellen (Strata- 
gene) transf ormiert und auf LB-Amp ausplattiert . Ein positiver 
Klon, der ein Fragment trug, wurde durch Minipraparationsanalyse 
identif iziert . Die Sequenz ierung ergab die in SEQ ID No. 3 
wiedergegebene Gesamtsequenz (= bioS2) . 

35 BioS2 wurde dann als Expressionskassette analog zu bioSl amplif i- 
ziert und kloniert. Dafiir wurden dem Gen durch PCR mit den Oligo- 
nukleotiden PbioS2 ,5 ( 5 ' -CATGACGCGTAAAGAGGAGAAATTAACTATGAAATTAC - 
CGATTTATTTGG-3 ' ) und PbioS2 ,6 ( 5 ' -GCGACGCGTGATTAATGATGAGCCCAT-3 ' ) 
eine Erkennungstelle fur Mlul und eine optimierte Shine-Dalgarno- 

40 sequenz auf der 5'Seite und eine Erkennungstelle fur Mlul auf der 
3'Seite zugefiigt. 

Durchfiihrung der PCR: 

45 Als Matrize wurden 0,5 (ag chromosomale DNA von W3110 eingesetzt. 
Die Oligonukleotide PbioS2,5 und PbioS2,6 wurden in einer Konzen- 
tration von je 15 pMol eingesetzt. Die Konzentrat ion an dNTP's 
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betrug 200 jiM. Als Polymerase wurden 2,5 U Pwo DNA-Polymerase 
(Boehringer Mannheim) im Reakt ionspuf f er des Herstellers ein- 
gesetzt. Das Volumen der PCR-Reaktion betrug 100 \xl . 

Ampl if ikat ionsbedingungen : 

Denaturierung 2 sec bei 94 °C, Anlagern der Oligonukleotide fur 
30 sec bei 55 °C, Elongation fur 45 sec bei 72 °C . Die PCR wurde 
iiber 30 Zyklen durchgef uhrt . 

Das erhaltene DNA-Produkt der richtigen GroBe von ca. 1200 bp 
wurde durch den PCR-Purif ica tion-Ki t (Boehringer Mannheim) auf - 
gereinigt und durch Mlul im geeigneten Puffer verdaut. 

5 jig des Vektors pHS2 wurden duch Mlul verdaut und durch Shrimp 
Alkalische Phosphatase (SAP) (Boehringer Mannheim) dephosphoryl - 
liert. Nach Denaturierung der SAP wurden Vektor und Fragment in 
einem molaren Verhaltnis von 1:3 durch den Rapid-DNA-Ligation Kit 
nach der Vorschrift des Herstellers ligiert. Die Transformation ; 
des Ligationsansatzes erfolgte in den Stamm XL-l-blue. Positive . 
Klone wurden durch Plasmidpraparation und Restriktionsanalyse 
identif iziert . Die richtige Orientierung des bioS2-Fragments in 
pHS2 wurde durch Res tr ikt ionsverdau und Sequenzierung bestimmt. 
Der Vektor wurde mit pHS2 bioS2 (Figur 3) bezeichnet. Die Sequenz 
von pHS2 bioS2 ist SEQ ID No, 11 zu entnehmen. Die abgeleitete 
Aminosauresequenz von bioS2 im Vektor ist SEQ ID No. 12 zu ent- * 
nehmen. Analog wurde die Klonierung von bioS2 in den Vektor pHSl 
vorgenornmen. Die Sequenz von pHSl bioS2 ist SEQ ID No . 7 zu ent- 
nehmen (Figur 4). Die abgeleitete Aminosauresequenz von bioS2 im 
Vektor ist SEQ ID No - 8 zu entnehmen. 

5. Konstruktion des Plasmids pHBbiol4 

Die in vivo-Klonierung des Bio-Operons wurde durch einen transdu- 
zierenden Lambda- Phagen durchgef uhrt . Die Selektion von Lambda 
bio + Phagen erfolgte durch die Transduktion eines E. coli bio- 
negativen Stammes zu bio + . Der isolierte bio + transduzierende 
Lambda Phage wurde propagiert und die Lambda DNA auf gereinigt . Es 
folgte die Excision eines 8,7 kb EcoRI/HinDII I-Fragments mit dem 
gesamten Biot in-Operon aus der Lambda-Phagen DNA und Ligation des 

"Wa^ents'HLrTTSBK^ 

Positive Klone wurden durch Plasmidpraparation und Restriktions- 
analyse identif iziert . 
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Deletion eines 1,2 Kb Fragments 3' von bioD 

Nicht benotigte Genseguenzen auf der 3'-Seite des bioD Gens wur- 
den entfernt. Dafur wurde durch PCR-Reaktion hinter dem Stopkodon 
von bioD eine EcoRI-Schni ttstelle eingebaut . Die Entwicklung der 
Oligonukleotide Pbiol, 1 (5' -AATAAGGAATTCTTATGTACTTTCCGGTTGCCG-3 ' ) 
und Pbiol, 2 ( 5 ' -AACAGCAGCCTGCAGCTGGATTA-3 ' ) fur diese PCR-Reak- 
tion erfolgte nach der Operon-Sequenz von Otsuka et al . (J. Biol. 
Chem. 263, 1988: 19577-85). 

PCR-Bedingungen : 

2,5 U Taq- Polymerase (Perkin Elmer) und je 15 pmol Primer wurden 
in einem Volumen von 100 j-il umgesetzt. Das Annealing wurde bei 
50 °C und die Elongation fur 1 min bei 72 °C uber 30 Zyklen 
durchgef uhrt . Isolierung und Aufreinigung eines 488 bp-Fragments 
erfolgte uber Agarose-Gel . Verdau des erhaltenen Fragments mit 
EcoRI/Pstl. Verdau von pHBbiol mit EcoRI/Pstl. Isolierung eines 
9,5 kb Fragments. 

Das 9,5 kb Fragments wurde mit dem 488 bp Fragments legiert und 
in XLl-blue-Zellen transf ormiert . Erhaltene Klone wurden durch 
Plasmidpraparation und durch Restriktionsanalyse der Plasmid-DNA 
mit den Enzymen EcoRI und HinDIII analysiert, positive Klone, die 
ein 5,9 kb Fragment trugen, wurden identif iziert . Es wurde ein 
Klon, der mit pHBbio2 bezeichnet wurde, isoliert. Von diesem Klbn 
wurde Plasmid-DNA gewonnen. 5 y.g pHBbio2 wurden mit EcoRI /HinDIII 
verdaut und das 5,9 kb Fragment isoliert, das die gesamten Bio- 
tin-Biosynthesegene enthielt. 

5 ng des Plasmids pAT153 wurden mit EcoRI und HinDIII verdaut. 
Das erhaltenen 5,9 kb Fragment mit den Biotin-Biosynthesegenen 
wurde mit dem verdauten Vektor pAT153 ligiert und in XL-l-blue 
transf ormiert . Erhaltene Klone wurden durch Plasmidpraparation 
und durch Restriktionsanalyse der Plasmid-DNA mit den Enzymen 
EcoRI und HinDIII analysiert. Positive Klone wurden identif iz iert 
und ein Klon mit der Bezeichnung pHbiol4 isoliert. 

6. Erhohung der Bio tin-Produk tivi ta t durch Uberexpression von 
bioSl 

Stamm BM4092 (Barker und Campbell) wurde durch eine Pl-Transduk- 
tion mit Hilf e eines Pl-Lysats, das auf einem recA: :Tnl0 tragen- 
dem Stamm gewachsen war, nach recA" transduziert . Der Erfolg der 
Transduktion wurde durch eine erhohte UV-Sensi tivitat der positi- 
ven Transduktanden nachgewiesen . Daraufhin wurde der erhaltene 
Stamm LU8091 mit dem Plasmid pHBbiol4 nach der CaCl2~Methode 
transf ormiert und auf LB-Ampizillin 100 |-ig/ml angezogen. Ein Klon 



WO 99/05285 



PCT/EP98/04097 



25 

wurde isoliert, und dieser wurde jeweils mit den Plasmiden pHSl 
bioSI und pKS2 bioS2 durch die CaCl 2 -Me thode transf ormiert und auf 
LB-Agar, Ampizillin 100 ng/ml und Kanamyzin 25 jag/ml selektio- 
niert . 

5 

Je eine Kolonie der jeweiligen Transf ormanden wurde in einer DYT- 
Kultur mit dem entsprechendem Antibiotika angeimpf t und fur 12 h 
inkubiert. Die Ubernachtkul tur (= UNK) wurde eingesetzt urn eine 
10 ml Kultur in TB-Medium (Sambrook, J. Fritsch, E F. Maniatis, 

0 T. 2nd ed. Cold Spring Harbor Laboratory Press., 1989 ISBN 
0-87969-373-8) mit den entsprechenden Antibiotika anzuimpfen und 
uber 24h Stunden angezogen. Nach Ende des Wachs turns wurden die 
Zellen vom Kul turiiberstand durch Zentr if ugation abgetrennt und 
die Biotin- und Dethiobiotin-Konzentration durch einen ELISA mit 

c Streptavidin und Avidin im Uberstand bestimmt. Die Ergebnisse 
dieser Bestimmung sind Tabelle I zu entnehmen. 

Tabelle I: Bestimmung der Biotin- und Dethiobiot inkonzentration 



Stamm 


Plasmid I 


Plasmid II 


Biotin mg/1 


Dethiobiotin mg/1 


Lu8091 


pHBbiol4 




9,4 


45,6 


Lu8091 


pHBbiol4 


pHSI bioSI 


15, 3 


19,7 


Lu8091 


pHBbiol4 


pHS2 bioSI 


19, 2 


15,8 
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Patentanspriiche 

1. verfahren zur Herstellung von Biotin, dadurch gekennzeichnet , 
daB man ein Biotingen mit der Sequenz SEQ ID No. 1 Oder 

SEQ ID No. 3 sowie seine f unktionellen Varianten, Analoge 
oder Derivate in einem prokaryontischen Oder, eukaryontischen 
Wirtsorganismus, der in der Lage ist Biotin zu synthetisie- 
ren, exprimiert, diesen ziichtet und das synthetisier te Biotin 
direkt, nach Abtrennung der Biomasse Oder nach Reinigung des 
Biotins verwendet. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , daB die 
Expression der Biotingene nach Anspruch 1 zu einer gesteiger- 
ten Umwandlung von Dethiobiotin in Biotin fiihrt. 

3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daB 
es sich bei den Varianten um Gene handelt, die auf der von 
den Sequenzen nach Anspruch 1 abgeleiteten Aminosaureebene 
eine Homologie von 40 bis 100 % aufweisen und eine gestei- 
gerte Biotinsynthese ermoglichen. 

4. Verfahren nach den Anspriichen 1 bis 3, dadurch gekennzeich- 
net, daB als Wirtsorganismus ein Organismus ausgewahlt aus 
der Gruppe der Gattungen Escherichia, Citrobacter, Serratia, 
Klebsiella, Salmonella, Pseudomonas, Comamonas, Acinetobac- 
ter, Azotobacter, Chromobacterium, Bacillus, Chlostridium, 
Ar throbacter , Corynebacterium, Brevibacterium, Lactococcus, 
Lactobacillus, Streptomyces , Rhizobium, Agrobacter ium, Sta- 
phylococcus, Rhodotorula, Sprorobolomyces , Yarrowia, Schizo- 

saccharomyces Oder Saccharomyces" verwendet wird. 

5. Verfahren nach den Anspriichen 1 bis 4, dadurch gekennzeich- 
net, daB als Wirtsorganismus eine regulat ionsdef ekte Biotin- 
mutante verwendet wird. 

6. Verfahren nach den Anspriichen 1 bis 5, dadurch gekennzeich- 
net, daB die Expression mindestens einer Kopie der Biotingene 
nach Anspruch 1 allein oder mit einer oder mehreren Kopien 
mindestens eines weiteren Biotingens ausgewahlt aus der 
Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, 
bioY oder bioR in einem prokaryontischen oder eukaryontischen 
Wirtsorganismus erfolgt. 

7. Genkonstrukt enthaltend ein Biotingen mit der SEQ ID No. 1 
oder SEQ ID No. 3, sowie seine f unktionel len Varianten, 
Analoge oder Derivate, das mit einem oder mehreren Regu- 



WO 99/05285 



27 



PCT/EP98/04097 



lationssignalen zur Erhohung der Genexpression und/oder 
Proteinexpress ion f unk t ionel 1 verknupft ist und/oder dessen 
naturliche Regulation ausgeschaltet v/urde. 

5 8. Genkonstrukt nach Anspruch 7, dadurch gekennzeichnet , daS es 
in einem Vektor inseriert wurde, der fur die Expression des 
Gens in einem prokaryontischen oder eukaryontischen Wirts- 
organismus geeignet ist. 

10 9. Genkonstrukt nach Anspruch 7 oder 8, dadurch gekennzeichnet, 
daS die Biotingene nach Anspruch 7 in einer oder mehreren 
Kopien zusammen mit einer oder mehreren Kopien mindestens 
eines weiteren Gens ausgewahlt aus der Gruppe bioA, bioB, 
bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY oder bioR 

15 im Vektor vorliegt. 

10. Organismen enthaltend ein Genkonstrukt gemaB den Anspriichen 7 
bis 9 . 

20 11. Verwendung einer Sequenz gemaS Anspruch 1 zur Herstellung von 
Biotin.- 

12. Verwendung eines Genkons trukts gemaB den Anspriichen 7 bis 9 - 
zur Herstellung von Biotin. 

25 
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1 Aatli 



Bgl II 3689 
Bci I 3684 
Eagl 3619 
Drdl 3498 
Bal i 3445 
Tth1 1 1 I 3407 



BsaAl 3223 

Sphl 3124 
Nae! 3025 
Ava II 3010 
Rsrll 3009 



Sac I 2839 
Sac I 2839 

Spe I 2727 

XbaJ 2657 
Sspl 2651 
Ase I 2638 
Ski I 255 
BstB I 255 




428 Aocl 
447 Eco47 III 
500 Nhe I 
506 Asp718 
506 Kpnl 
536 Clal 
542 HinO 111 
554 EcoR I 
566 Smal 
566 Xma I 
572 BamH I 
589 Mlu I 



7 Dralll 



Avrll 1924 



1873 
Mlu I 



1651 Bgl I 
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1 Aat II 
23 BspHi 
68 Bbv II 
177 
177 
183 
183 
198 



Asp718 
Kpn I 
Apa I 
iApa I 
Acc I 



Bgl II 3360 
Bel I 3355 
Eag I 3290 



198 Sal i 
207 Cla I 
213 HinDIII 
237 Smal 
237 Xmal 
243 BamHI 
255 Mlu 



Tthii 



BsaAi 2894 

Sphl 2795 
Nae I 2696 
Ava II 2681 
Rsrll 2680 ■=? 



iSacI 2510 " 
Sac! 2510 

Spe 1 2398 



Xbal 2328 
Sspl 2322 
Asel 2309 
Sful 2222 
BstBI 2222 




1028 Dra III 



1322 Bgl I 



Age! 1896 



1478 Mlu I 
1595 Avrl 
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Fi<\ur 3 



1 Aatll 
23 BspHI 
68 Bbvll 
177 
177 
183 
183 
198 



Asp718 
Kpn I 
Apa I 
iApa I 
Acc I 



Eag 
Drdl 3185 
Bal I 3132 
Fspl 3112 
Tth111 I 3094 



Xcml 3394 
Bgl II 3376 
Bel I 3371 
3306 



198 Sail 
207 Clal 
213 HinD III 
237 Smal 
237 Xmal 
243 BamHI 
313 BstX I 
316 SgrAI 



Sphl 2811 



Nael 2712 
Rsrll 2696 



iSacI 2526 " 
Sac I 2526 

Spel 2414 

Xbal 2344 
Sspl 2338 
Asel 2325 
Sfu I 2238 
BstB I 2238 
AiwN 




618 Gsul 



— 824 PflM I 

870 Earn 11051 
• 947 Spl I 

1039 Stul 



\ 1495 Mlu. I 
1611 Avrll 
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1 Aat 



Tthi 1 1 



Xcml 3723 
Bgl II 3705 
Bel I 3700 
Eag I 3635 
Drdl 3514 
3al I 3461 \L 
Fspt 3441 
3423 



Sph I 3140 



Nae I 3041 
Rsr II 3025 



iSac I 2855 
Sac I 2855 
Spe I 2743 

Xbal 2673 
Ssp I 2667 
Asel 2654 
Sfu I 2567 
BstB I 2567 

AlwN I 2429 




pHSl bioS2 

+ 

3810 base pairs 
Unique Sites 



Agel 2241 

Hgal 2137 
Sac II 2080 




428 Aocl 
447 Eco47 111 
500 Nhe I 
506 Asp718 
506 Kpn I 
536 Cla I 
542 HinD 111 
554 EcoR I 
566 Sma I 
566 Xma I 
572 BamH 1 
642 BstX i 
645 SgrAI 



1 1824 Mlu 



_ 947 Gsu 



1153 PflM I 
1199 Earn 11051 



368 



276 Spl I 
Stu I 



Avrll 1940 
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SEQUENZ PROTOKOLL 

(1) ALGEMEINE INFORMATION: 

( i ) ANMELDER : 

(A) NAME: BASF Akt iengesellschaf t 

(B) STRASSE: Carl Bosch Strasse 

(C) ORT: Ludwigshafen 

(D) BUNDESLAND: Rheinland-Pf alz 

(E) LAND: Germany 

(F) POSTLEITZAHL: D-67056 

(ii) ANMELDETITEL: Verfahren zur Herstellung von Biotin 
(iii) ANZAHL DER SEQUENZEN: 12 



(iv) COMPUTE R-LESBARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.25 (EPA) 
(2) INFORMATION ZU SEQ ID NO : 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE : 1217 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT : 

(A) ORGANISMUS: Escherichia coli 

(B) STAMM: W3110 

(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL : 5 ' UTR 

(B) LAGE: 1 . . 11 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

( B ) LAGE: 12.. 1217 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT 50 
Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe 
1-5 10 
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CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG 9 8 

Pro Ala Leu Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala 
15 20 25 

CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG 146 
Leu Lys Pro Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu 
30 35 40 45 

AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG 194 
Ser Ala Gly Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu 

50 55 60 

ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT 242 
Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn 
65 70 75 

GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC 290 
Ala Pro Asp Asp Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser 
80 85 90 

ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC 338 
He Asn Met Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly 
95 100 105 

GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC . 3 86 

Asp Glu He He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro 
HO 115 120 125 

TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG 4 34 

Trp Leu Met Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro 

130 135 140 

CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT 4 82 

Leu Asn Ala Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He 
145 150 155 

ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT 53 0 

Thr Pro Arg Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr 
160 165 170 

GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC 57 8 

Gly Gly Cys Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala 
175 180 185 

-GGG-A-TG-GT-G- -flrp.fi„ATG-GT_T._ GAT GGT GC T CAG GGG GCA GTG CAT TTC CCC 626 

Gly Met Val Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro 
190 195 200 205 

GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC 674 
Ala Asp Val Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His 

210 215 220 
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AAA CTG TAT GGC CCG AC A GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA 7 22 

Lys Leu Tyr Gly Pro Thr Gly lie Gly Val Leu Tyr Gly Lys Ser Glu 
225 230 235 

CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC 770 
Leu Leu Glu Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His 
240 245 250 

GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG 818 
Glu Val Ser Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu 
255 260 265 

GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG 866 
Glu Ala Gly Thr Pro Asn Val Ala Gly Val lie Gly Leu Ser Ala Ala 
270 275 280 285 

CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC 914 
Leu Glu Trp Leu Ala Asp Tyr Asp lie Asn Gin Ala Glu Ser Trp Ser 

290 295 300 

CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC 962 
Arg Ser Leu Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly 
305 310 315 

TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT 1010 
Phe Arg Ser Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe 
320 325 330 

GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT 1058 
Ala Gly Val His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly 
335 340 345 

ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA 1106 
lie Ala Leu Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu 
350 355 360 365 

TTA GGC GTA ACC GGC AC A CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA 1154 
Leu Gly Val Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr 

370 375 380 

AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA 12 02 

Lys Ser Asp Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu 
385 390 395 

TTA TTG GTG GAT TA 1217 
Leu Leu Val Asp 
400 

(2) INFORMATION ZU SEQ ID NO: 2: 

(i) SEQUENZ CHARAKTERI STIKA : 
(A) LANGS: 401 Aminosauren 
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(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 5 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 . 40 45 

Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

Asp Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 HO 

He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
H5 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

Ser Arg lie Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 

165 170 175 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
!95 200 205 



"Gl^~GlxT _ Leu Asp Ile~Asp ~Phe~Ty r -A-i-a-Phe- Se r-G -1-y-H-i :-s- -Lys- Leu- Tyr- 
210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 



gNSDOCID:<WO 9905285 A1> 



WO 99/05285 



5 / 31 



PCT/EP98/04097 



Phe Asp Gly Phe 
260 

Thr Pro Asn Val 
275 

Leu Ala Asp Tyr 
290 

Ala Thr Leu Ala 
305 

Phe Arg Cys Gin 



His His Ser Asp 
340 

Arg Ala Gly Gin 
355 

Thr Gly Thr Leu 
370 

Val Asp Ala Leu 
385 

Asp 



Thr Thr Gin Ser 



Ala Gly Val He 
280 

Asp He Asn Gin 
295 

Glu Asp Ala Leu 
310 

Asp Ser Ser Leu 
325 

Met Val Thr Leu 



His Cys Ala Gin 
360 

Arg Ala Ser Phe 
375 

Val Asn Ala Val 
390 



Ala Pro Trp Lys 
265 

Gly Leu Ser Ala 



Ala Glu Ser Trp 
300 

Ala Lys Arg Pro 
315 

Leu Ala Phe Asp 
330 

Leu Ala Glu Tyr 
345 

Pro Leu Leu Ala 



Ala Pro Tyr Asn 
380 

Asp Arg Ala Leu 
395 



Leu Glu Ala Gly 
270 

Ala Leu Glu Trp 
285 

Ser Arg Ser Leu 



Gly Phe Arg Ser 
320 

Phe Ala Gly Val 
335 

Gly He Ala Leu 
350 

Glu Leu Gly Val 
365 

Thr Lys Ser Asp 



Glu Leu Leu Val 
400 



(2) INFORMATION ZU SEQ ID NO : 3: 

(i) SEQUENZ CHARAKTERI STIKA : 

(A) LANGE: 1233 Basenpaare 
<B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT : 

(A) ORGANISMUS: Escherichia coli 

(B) STAMM: W3110 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 19.. 1233 
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(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL : 5 ' UTR 

(B) LAGE: 1 . . 18 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

AAAGAGGAGA AATTAACT ATG AAA TTA CCG ATT TAT CTC GAC TAC TCC GCA 51 

Met Lys Leu Pro lie Tyr Leu Asp Tyr Ser Ala 
15 10 

ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG 99 
Thr Thr Pro Val Asp Pro Arg Val Ala Glu Lys Met Met Gin Phe Met 
15 20 25 

ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC 147 
Thr Met Asp Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe 
30 35 40 

GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC 195 
Gly Trp Gin Ala Glu Glu. Ala Val Asp lie Ala Arg Asn Gin lie Ala 
45 50 _ . 55 

GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA 24 3 

Asp Leu Val Gly Ala Asp Pro Arg Glu He Val Phe Thr Ser Gly Ala 
60 65 70 75 

ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG 291 
Thr Glu Ser Asp Asn Leu Ala He Lys Gly Ala Ala Asn Phe Tyr Gin 

80 85 90 

AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA 3 39 

Lys Lys Gly Lys His He He Thr Ser Lys Thr Glu His Lys Ala Val 
95 . 100 105 

CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC 3 87 

Leu Asp Thr Cys Arg Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr 
1-1-0 115 120 

CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA 4 35 

Leu Ala Pro Gin Arg Asn Gly He He Asp Leu Lys Glu Leu Glu Ala 
125 130 135 

GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC ATC ATG CAC GTA AAT AAC 4 83 

Ala Met Arg Asp Asp Thr He Leu Val Ser He Met His Val Asn Asn 
_14.0 145 [ 150 155 



GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT ATC GGC GAA ATG TGC CGT 531 
Glu lie Gly Val Val Gin Asp He Ala Ala He Gly Glu Met Cys Arg 

160 165 170 

GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA ■ 579 

Ala Arg Gly He He Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys 
175 180 185 
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CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC 6 27 

Leu Pro lie Asp Leu Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser 
190 195 200 

GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT 67 5 

Gly His Lys lie Tyr Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg 
205 210 215 

CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC 7 23 

Arg Lys Pro Arg Val Arg He Glu Ala Gin Met His Gly Gly Gly His 
220 225 230 235 

GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA 771 
Glu Arg Gly Met Arg Ser Gly Thr Leu Pro Val His Gin He Val Gly 

240 245 250 

ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG 819 
Met Gly Glu Ala Tyr Arg He Ala Lys Glu Glu Met Ala Thr Glu Met 
255 260 265 

GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT 867 
Glu Arg Leu Arg Gly Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp 
270 275 280 

ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC 915 
He Glu Glu Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn 
285 290 295 

ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG 9 63 

He Leu Asn Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met 
300 305 310 315 

GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA 1011 
Ala Leu Lys Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala 

320 325 330 

AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG 1059 
Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu 
335 340 345 

CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA 1107 
Leu Ala His Ser Ser He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu 
350 . 355 360 

GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT 115 5 

Glu Glu He Asp Tyr Thr He Glu Leu Val Arg Lys Ser He Gly Arg 
365 370 375 

CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT 12 03 

Leu Arg Asp Leu Ser Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp 
380 385 390 395 
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CTG AAC AGC ATC GAA TGG GCT CAT CAT TA 1233 
Leu Asn Ser lie Giu Trp Ala His His 

400 405 

(2) INFORMATION ZU SEQ ID NO: 4: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 404 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met Lys Leu Pro He Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 
1 5 10 15 

Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 45 

Glu Ala Val Asp He Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala 
50 55 60 

Asp Pro Arg Glu He Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

Leu Ala He Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 

He He Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 HO 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly He He Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

Thr He Leu Val Ser He Met His Val Asn Asn Glu He Gly Val Val 
145 150 155 160 

— G-ln-Asp- He_Ala _Al_a He Gl y Gl u Met Cys Arg Ala Arg G ly He He 

16 5 17° irs 

Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu 
180 185 190 

Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys He Tyr 
195 200 205 
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Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 
210 215 220 

Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 

Ser Gly Thr Leu Pro Val His Gin He Val Gly Met Gly Glu Ala Tyr 

245 250 255 

Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp He Glu Glu Val Tyr 
275 280 285 

Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn He Leu Asn Val Ser 
290 295 300 

Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu 
305 310 315 320 

Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 

325 330 335 

Tyr Val Leu Arg Ala Leu' Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu lie Asp Tyr 
355 360 365 

Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser 
370 375 380 

Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu 
385 390 395 400 

Trp Ala His His 

(2) INFORMATION ZU SEQ ID NO: 5: 

(i) SEQUENZ CHARAKTERI STIKA : 

(A) LANGE: 3794 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANG FORM : Einzel 

(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKULS : DNS (genomisch) 
(iii) HYPOTHETISCH : NEIN 
(iii) ANTI SENSE : NEIN 
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(vii) UNMITTELBARE HERKUNFT: 
(Bi CLON: pHSlbioSl 

(ix) MERKMALE: 

(A) NAME / SCHLUSSEL : CDS 

(B) LAGE: 601.. 1806 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 

GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG . GACACCGAGG 6 0 

AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 120 

GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 180 

AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 240 

AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 3 00 

AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 360 

ATGTCC TG AG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 4 20 

AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 4 80 

GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA 54 0 

TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTC GAGGAGTACC 6 00 

ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT CCC GCA CTA 648 
Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 5 10 15 

CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG CTT AAA CCT 696 
Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG AGC GCC GGA 744 
Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG ACC GCG CGT 792 
Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT GCA CCG GAT 

— Tyr^nu-A-l-a-Ad-a-A-r-g-GlAi-Ly 

65 70 75 80 

GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC ATC AAC ATG . 
Asp Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 



84 0 



888 
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GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC GAT GAG ATT 936 
Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu lie 
100 105 110 

ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC TGG CTG ATG 9 84 

lie Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG CTT AAT GCG 1032 
Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT ACT CCC CGT 1080 
Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu lie Thr Pro Arg 
145 150 155 160 

AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT GGC GGT TGC 1128 
Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 

165 170 175 

CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC GGG ATG GTG 1176 
Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC GCG GAT GTT 12 24 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC AAA CTG TAT 12 72 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA CTG CTG GAG 13 2 0 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 2-30 235 240 

GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC GAA GTG AGT 13 68 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 

TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG GAA GCT GGA 1416 
Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG CTG GAA TGG 14 64 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280- 285 

CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC CGT AGC TTA 1512 
Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 
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GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC TTT CGT TCA 156 0 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT GCT GGC GTT 16 08 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT ATT GCC CTG 16 56 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly lie Ala Leu 
340 345 350 

CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA TTA GGC GTA 17 04 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA AAG AGT GAT 17 52 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA TTA TTG GTG 18 00 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

GAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC _18 53 

Asp 



TGGGCCTTTC 


GTTTTATCTG 


TTGTTTGTCG 


GTGAACGCTC 


TCCTGAGTAG 


GACAAATCCG 


^1913 


CCGCCCTAGA 


CCTAGGGGAT 


ATATTCCGCT 


TCCTCGCTCA 


CTGACTCGCT 


ACGCTCGGTC 


1973 


GTTCGACTGC 


GGCGAGCGGA 


AATGGCTTAC 


GAACGGGGCG 


GAGATTTCCT 


GGAAGATGCC 


2033 


AGGAAGATAC 


TTAACAGGGA 


AGTGAGAGGG 


CCGCGGCAAA 


GCCGTTTTTC 


CATAGGCTCC 


2093 


GCCCCCCTGA 


CAAGCATCAC 


GAAATC TG AC 


GCTCAAATCA 


GTGGTGGCGA 


AACCCGACAG 


2153 


GAC T AT AAAG 


ATACCAGGCG 


TTTCCCCCTG 


GCGGCTCCCT 


CGTGCGCTCT 


CCTGTTCCTG 


2213 


CCTTTCGGTT 


TACCGGTGTC 


ATTCCGCTGT 


TATGGCCGCG 


TTTGTCTCAT 


TCCACGCCTG 


2273 


ACACTCAGTT 


CCGGGTAGGC 


AGTTCGCTCC 


AAGCTGGACT 


GTATGCACGA 


ACCCCCCGTT 


2333 


CAGTCCGACC 


GCTGCGCCTT 


ATCCGGTAAC 


TATCGTCTTG 


AGTCCAACCC 


GGAAAGACAT 


2393 


GCAAAAGCA'C" 


-CACTGGCAGC- 


-AGCeACTGGT- 


-AAT-T G A-TT-TA- 


-GAGGAGT-TAG- 


-T.CTTGAAGTC 


2453 


ATGCGCCGGT 


TAAGGCTAAA 


CTGAAAGGAC 


AAGTTTTGGT 


GACTGCGCTC 


CTCCAAGCCA 


2513 


GTTACCTCGG 


TTCAAAGAGT 


TGGTAGCTCA 


GAGAACCTTC 


GAAAAACCGC 


CCTGCAAGGC 


2573 


GGTTTTTTCG 


TTTTCAGAGC 


AAGAGATTAC 


GCGCAGACCA 


AAACGATCTC 


AAGAAGATCA 


2633 


TCTTATTAAT 


CAGATAAAAT 


ATTTCTAGAT 


TTCAGTGCAA 


TTTATCTCTT 


CAAATGTAGC 


2693 
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ACCTGAAGTC AGCCCCATAC GATATAAGTT GTTACTAGTG CTTGGATTCT C AC C AATAAA 27 53 

AAACGCCCGG CGGCAACCGA GCGTTCTGAA CAAATCCAGA TGGAGTTCTG AGGTCATTAC 2813 

TGGATCTATC AACAGGAGTC CAAGCGAGCT CTCGAACCCC AGAGTCCCGC TCAGAAGAAC 2 87 3 

TCGTCAAGAA GGC GATAGAA GGCGATGCGC TGCGAATCGG GAGCGGCGAT ACCGTAAAGC 29 33 

ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA AGCTCTTCAG CAATATCACG GGTAGCCAAC 29 93 

GCTATGTCCT GATAGCGGTC CGCCACACCC AGCCGGCCAC AGTCGATGAA TCCAGAAAAG 3053 

CGGCCATTTT CCACCATGAT ATTCGGCAAG CAGGCATCGC CATGGGTCAC GACGAGATCC 3113 

TCGCCGTCGG GCATGCGCGC CTTGAGCCTG GCGAACAGTT CGGCTGGCGC GAGCCCCTGA 3173 

TGCTCTTCGT CCAGATCATC CTGATCGACA AGACCGGCTT CCATCCGAGT ACGTGCTCGC 3233 

TCGATGCGAT GTTTCGCTTG GTGGTCGAAT GGGCAGGTAG CCGGATCAAG CGTATGCAGC 32 9 3 

CGCCGCATTG CATCAGCCAT GATGGATACT TTCTCGGCAG GAGCAAGGTG AGATGACAGG 33 53 

AGATCCTGCC CCGGCACTTC GCCCAATAGC AGCCAGTCCC TTCCCGCTTC AGTGACAACG 3413 

TCGAGCACAG CTGCGCAAGG AACGCCCGTC GTGGCCAGCC ACGATAGCCG CGCTGCCTCG 34 7 3 

TCCTGCAGTT CATTCAGGGC ACCGGACAGG TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC 3 53 3 

TGCGCTGACA GCCGGAACAC GGCGGCATCA GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA 3 593 

TAGCCGAATA GCCTCTCCAC CCAAGCGGCC GGAGAACCTG CGTGCAATCC ATCTTGTTCA 36 53 

ATCATGCGAA ACGATCCTCA TCCTGTCTCT TGATCAGATC TTGATCCCCT GCGCCATCAG 3713 

ATCCTTGGCG GCAAGAAAGC CATCCAGTTT ACTTTGCAGG GCTTCCCAAC CTTACCAGAG 37 7 3 

GGCGCCCCAG CTGGCAATTC C 3794 
(2) INFORMATION ZU SEQ ID NO: 6: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 401 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZ BE SCHREIBUNG-: SEQ ID NO: 6: 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
! 5 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 
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Glu Ala val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

Asp Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 110 

He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 
.245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 

2~ 5 - 280 2-8 5 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 • 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
3 05 310 315 320 
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Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 

325 330 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly lie Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

Asp 

(2) INFORMATION ZU SEQ ID NO : 7: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 3810 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE : ringf ormig 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(iii) HYPOTHETISCH: NEIN 

(iii) ANTISENSE: NEIN 

(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: pHSlbioS2 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 608. .1822 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 

GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 6 0 

AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 12 0 

GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 180 

AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 24 0 

AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 3 00 

AACAGC TACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 360 

ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 4 20 
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AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 4 80 

GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA 54 0 

TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTA AAGAGGAGAA 6 00 

ATTAACT ATG AAA TTA CCG ATT TAT CTC GAC TAC TCC GCA ACC ACG CCG 6 49 

Met Lys Leu Pro lie Tyr Leu Asp Tyr Ser Ala Thr Thr Pro 
15 10 

GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG ACG ATG GAC 6 97 

Val Asp Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp 
15 20 25 30 

GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC GGC TGG CAG 745 
Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin 

35 40 45 

GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC GAT CTG GTC 793 
Ala Glu Glu Ala Val Asp lie Ala Arg Asn Gin lie Ala Asp Leu Val 
50 55 60 

GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA ACC GAA TCT 841 
Gly Ala Asp Pro Arg Glu lie Val Phe Thr Ser Gly Ala Thr Glu Ser . 
65 70 75 

GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG AAA AAA GGC 8 89 

Asp Asn Leu Ala lie Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly 
80 85 90 

AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA CTG GAT ACC 9 37 

Lys His lie lie Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr 
95 100 105 110 

TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC CTG GCA CCG 9 85 

Cys Arg Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro 

115 120 125 

CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA GCG -ATG CGT 1033 
Gin Arg Asn Gly lie lie Asp Leu Lys Glu Leu Glu Ala Ala Met Arg 
130 135 140 

GAC GAC ACC ATC CTC GTG TCC ATC ATG CAC GTA AAT AAC GAA ATC GGC 1081 
Asp Asp Thr lie Leu Val Ser lie Met His Val- Asn Asn Glu lie Gly 
145 150 155 



GTG GTG CAG GAT ATC GCG GCT ATC GGC GAA ATG TGC CGT GCT CGT GGC 1129 

Val Val Gin Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly 
160 165 170 

ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA CTG CCT ATC 1177 

He He Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He 
175 180 185 190 
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GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC GGT CAC AAA 12 2 5 

Asp Leu Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys 

195 200 205 

ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT CGT AAA CCG 1273 
lie Tyr Gly Pro Lys Gly lie Gly Ala Leu Tyr Val Arg Arg Lys Pro 
210 215 220 

CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC GAG CGC GGT 1321 
Arg Val Arg lie Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly 
225 230 235 

ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA ATG GGC GAG 13 69 

Met Arg Ser Gly Thr Leu Pro Val His Gin lie Val Gly Met Gly Glu 
240 245 250 

GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG GAA CGT CTG 1417 
Ala Tyr Arg lie Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu 
255 260 265 270 

CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT ATC GAA GAA 14 6 5 

Arg Gly Leu Arg Asn Arg Leu Trp Asn Gly lie Lys Asp lie Glu Glu 

275 280 285 

GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC ATT CTC AAC 1513 
Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn lie Leu Asn 
290 295 300 

GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG GCG CTG AAA 1561 
Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu lie Met Ala Leu Lys 
305 310 315 

GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA AGC CTC GAA 1609 
Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu 
320 325 330 

CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG CTG GCA CAT 16 57 

Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His 
335 340 345 350 

AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA GAA GAG ATC 17 05 

Ser Ser lie Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu lie 

355 360 365 

GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT CTG CGT GAC 17 53 

Asp Tyr Thr lie Glu Leu Val Arg Lys Ser. lie Gly Arg Leu Arg Asp 
370 " 375 380 

CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT CTG AAC AGC 1801 
Leu Ser Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser 
385 390 395 
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ATC GAA TGG GCT CAT CAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC 184 9 

lie GIu Trp Ala Kis His 



400 




405 










GAAAGGCTCA 


GTCGAAAGAC 


TGGGCCTTTC 


GTTTTATCTG 


TTGTTTGTCG 


GTGAACGCTC 


1909 


TCCTGAGTAG 


GACAAATCCG 


CCGCCCTAGA 


CCTAGGGGAT 


ATATTCCGCT 


TCCTCGCTCA 


1969 


CTGACTCGCT 


ACGCTCGGTC 


GTTCGACTGC 


GGCGAGCGGA 


AATGGCTTAC 


GAACGGGGCG 


2029 


GAG ATTTC C T 


GGAAGATGCC 


AGGAAGATAC 


TTAACAGGGA 


AGTGAGAGGG 


CCGCGGCAAA 


2089 


GCCGTTTTTC 


CATAGGCTCC 


GCCCCCCTGA 


CAAGCATCAC 


GAAATCTGAC 


GCTCAAATCA 


2149 


GTGGTGGCGA 


AACCCGACAG 


GACTATAAAG 


ATACCAGGCG 


TTTCCCCCTG 


GCGGCTCCCT 


2209 


CGTGCGCTCT 


CCTGTTCCTG 


CCTTTCGGTT 


TACCGGTGTC 


ATTCCGCTGT 


TATGGCCGCG 


2269 


TTTGTCTCAT 


TCCACGCCTG 


ACACTCAGTT 


CCGGGTAGGC 


AGTTCGCTCC 


AAGCTGGACT 


2329 


GTATGCACGA 


ACCCCCCGTT 


CAGTCCGACC 


GCTGCGCCTT 


ATCCGGTAAC 


TATCGTCTTG 


2389 


AGTCCAACCC 


GGAAAGACAT 


GCAAAAGCAC 


CACTGGCAGC 


AGCCACTGGT 


AATTGATTTA 


' 2449 


GAGGAGTTAG 


TCTTGAAGTC 


ATGCGCCGGT 


TAAGGCTAAA 


CTGAAAGGAC 


AAGTTTTGGT 


2509 


GACTGCGCTC 


CTCCAAGCCA 


GTTACCTCGG 


TTCAAAGAGT 


TGGTAGCTCA 


GAGAACCTTC 


. 2569 


GAAAAACCGC 


CCTGCAAGGC 


GGTTTTTTCG 


TTTTCAGAGC 


AAGAGATTAC 


GCGCAGACCA 


2629 


AAACGATCTC 


AAGAAGATCA 


TCTTATTAAT 


CAGATAAAAT 


ATTTCTAGAT 


TTCAGTGCAA 


~ 2689 


TTTATCTCTT 


CAAATGTAGC 


ACCTGAAGTC 


AGCCCCATAC 


GATATAAGTT 


GTTACTAGTG 


2749 


CTTGGATTCT 


C AC C AAT AAA 


AAACGCCCGG 


CGGCAACCGA 


GCGTTCTGAA 


CAAATCCAGA 


2809 


TGGAGTTCTG 


AGGTCATTAC 


TGGATCTATC 


AACAGGAGTC 


CAAGCGAGCT 


CTCGAACCCC 


2869 


AGAGTCCCGC 


TCAGAAGAAC 


TCGTCAAGAA 


GGCGATAGAA 


GGCGATGCGC 


TGCGAATCGG 


2929 


GAGCGGCGAT 


ACCGTAAAGC 


ACGAGGAAGC 


GGTCAGCCCA 


TTCGCCGCCA 


AGCTCTTCAG 


2989 


CAATATCACG 


GGTAGCCAAC 


GCTATGTCCT 


GATAGCGGTC 


CGCCACACCC 


AGCCGGCCAC 


3049 


AGTCGATGAA 


TCCAGAAAAG 


CGGCCATTTT 


CCACCATGAT 


ATTCGGCAAG 


CAGGCATCGC 


3109 


CATGGGTCAC 


GACGAGATCC 


TCGCCGTCGG 


GCATGCGCGC 


CTTGAGCCTG 


GCGAACAGTT 


3169 


CGGCTGGCGe 


GAGGGGGTGA 
ACGTGCTCGC 


— TGCTCT-TCGT- 


„CCAGATCATC_ 


_C TG AT C G AC A 


AGACCGGCTT 


3229 


CCATCCGAGT 


TCGATGCGAT 


GTTTCGCTTG 


GTGGTCGAAT 


GGGCAGGTAG 


3289 


CCGGATCAAG 


CGTATGCAGC 


CGCCGCATTG" 


CATCAGCCAT 


GATGGATACT 


TTCTCGGCAG 


3349 


GAGCAAGGTG 


AGATGACAGG 


AGATCCTGCC 


CCGGCACTTC 


GCCCAATAGC 


AGCCAGTCCC 


3409 


TTCCCGCTTC 


AGTGACAACG 


TCGAGCACAG 


CTGCGCAAGG 


AACGCCCGTC 


GTGGCCAGCC 


3469 
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ACGATAGCCG 


CGCTGCCTCG 


TCCTGCAGTT 


CATTCAGGGC 


ACCGGACAGG 


TCGGTCTTGA 


3529 


CAAAAAGAAC 


CGGGCGCCCC 


TGCGCTGACA 


GCCGGAACAC 


GGCGGCATCA 


GAGCAGCCGA 


3589 


TTGTCTGTTG 


TGCCCAGTCA 


TAGCCGAATA 


GCCTCTCCAC 


CCAAGCGGCC 


GGAGAACCTG 


3649 


CGTGCAA 1 


A iL 1 1 b 1 1 


ATCATHTfiAA 


APCiATCCTCA 


TCCTGTCTCT 


TGATCAGATC 


3709 


TTGATCCCCT 


GCGCCATCAG 


ATCCTTGGCG 


GCAAGAAAGC 


CATCCAGTTT 


ACTTTGCAGG 


3769 


GCTTCCCAAC 


CTTACCAGAG 


GGCGCCCCAG 


CTGGCAATTC 


C 




3810 



(2) INFORMATION ZU SEQ ID NO : 8: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 404 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Met Lys Leu Pro lie Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 
15 10 15 

Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 4 45 

Glu Ala Val Asp lie Ala Arg Asn Gin lie Ala Asp Leu Val Gly Ala 
50 55 60 

Asp Pro Arg Glu lie Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

Leu Ala lie Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 

lie lie Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 110 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly lie lie Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

Thr lie Leu Val Ser lie Met His Val Asn Asn Glu lie Gly Val Val 
145 150 155 160 

Gin Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly He He 

165 170 175 
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Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro lie Asp Leu 
180 195 190 

Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys lie Tyr 
195 200 205 

Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 
210 215 220 

Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 

Ser Gly Thr Leu Pro Val His Gin He Val Gly Met Gly Glu Ala Tyr 
245 250 255 

Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

Leu Arg Asn Arg Leu Trp Asn Gly lie Lys Asp He Glu Glu Val Tyr 
275 280 285 

Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn He Leu Asn Val Ser 
290 295 300 

Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu 
305 310 315 320 

Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 

325 330 335 

Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr 
355 360 365 

-Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser 
37 0 37 5 3 80 

Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu 
385 390 395 400 

Trp Ala His His 



(2) INFORMA TION ZU SEQ ID NO: 9: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 34 6 5 ' Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKULS: DNS (genomisch) 
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(iii) HYPOTHETISCH: NEIN 

(iii) ANTISENSE: NEIN 

(vii) UNM I TTELBARE HERKUNFT: 
(B) CLON: pHS2bioSl 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 272.. 1477 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

GACGTCTAAG AAACCATTAT TATCATGACA TTAAC CT AT A AAAATAGGCG TATCACGAGG 60 

CCCTTTCGTC TTCACCTCGA GTCCCTATCA GT GAT AG AG A TTGACATCCC TATCAGTGAT 12 0 

AG AG AT AC TG AGCACATCAG CAGGACGCAC TGACCGAATT CATTAAAGAG GAGAAAGGTA 180 

CCGGGCCCCC CCTCGAGGTC GACGGTATCG ATAAGCTTGA TATCGAATTC CTGCAGCCCG 24 0 

GGGGATCCCA TGGTACGCGT CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG 2 92 

Met Asn Val Phe Asn Pro Ala 
1 5 

CAG TTT CGC GCC CAG TTT CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC 34 0 

Gin Phe Arg Ala Gin Phe Pro Ala Leu Gin Asp Ala Gly Val Tyr Leu 
10 15 20 

GAC AGC GCC GCG ACC GCG CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC 3 88 

Asp Ser Ala Ala Thr Ala Leu Lys Pro Glu Ala Val Val Glu Ala Thr 
25 30 35 

CAA CAG TTT TAC AGT CTG AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT 4 36 

Gin Gin Phe Tyr Ser Leu Ser Ala Gly Asn Val His Arg Ser Gin Phe 
40 45 50 55 

GCC GAA GCC CAA CGC CTG ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA 4 84 

Ala Glu Ala Gin Arg Leu Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys 

60 65 70 

GTG GCG CAA TTA CTG AAT GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG 532 
Val Ala Gin Leu Leu Asn Ala Pro Asp Asp Lys Thr lie Val Trp Thr 
75 80 85 

CGC GGC ACC ACT GAA TCC ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT 580 
Arg Gly Thr Thr Glu Ser lie Asn Met Val Ala Gin Cys Tyr Ala Arg 
90 95 100 

CCG CGT CTG CAA CCG GGC GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC 628 
Pro Arg Leu Gin Pro Gly Asp Glu lie' lie Val Ser Val Ala Glu His 
105 110 115 
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CAC GCC AAC CTC GTC CCC TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC 67 6 

His Ala Asn Leu Val Pro Trp Leu Met Val Ala Gin Gin Thr Gly Ala 
120 125 130 135 

AAA GTG GTG AAA TTG CCG CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT 7 24 

Lys Val Val Lys Leu Pro Leu Asn Ala Gin Arg Leu Pro Asp Val Asp 

140 145 150 

TTG TTG CCA GAA CTG ATT ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT 7 72 

Leu Leu Pro Glu Leu He Thr Pro Arg Ser Arg He Leu Ala Leu Gly 
155 160 165 

CAG ATG TCG AAC GTT ACT GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT 820 
Gin Met Ser Asn Val Thr Gly Gly Cys Pro Asp Leu Ala Arg Ala He 
170 175 180 

ACC TTT GCT CAT TCA GCC GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG 86 8 

Thr Phe Ala His Ser Ala Gly Met Val Val Met Val Asp Gly Ala Gin 
185 190 195 

GGG GCA GTG CAT TTC CCC GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC 916 
Gly Ala Val His Phe Pro Ala Asp Val Gin Gin Leu Asp He Asp Phe 
200 205 210 215 

TAT GCT TTT TCA GGT CAC AAA CTG TAT GGC CCG ACA GGT ATC GGC GTG 9 64 

Tyr "Ala Phe Ser Gly His Lys . Leu Tyr Gly Pro Thr Gly He Gly Val • 

220 225 230 

CTG TAT GGT AAA TCA GAA CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC - 1012 

Leu Tyr Gly Lys Ser Glu Leu Leu Glu Ala Met Ser Pro Trp Leu Gly 
235 240 245 

GGC GGC AAA ATG GTT CAC GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA 10 60 

Gly Gly Lys Met Val His Glu Val Ser Phe Asp Gly Phe Thr Thr Gin 
250 255 260 

TCT GCG CCG TGG AAA CTG GAA - GCT GGA ACG CCA AAT GTC GCT GGT GTC 1108 
Ser Ala Pro Trp Lys Leu Glu Ala Gly Thr Pro Asn Val Ala Gly Val 
265 270 275 

ATA GGA TTA AGC GCG GCG CTG GAA TGG CTG GCA . GAT TAC GAT ATC AAC 1156 
He Gly Leu Ser Ala Ala Leu Glu Trp Leu Ala Asp Tyr Asp He Asn 
280 285 290 295 

- eA g-.r T r.r.r, A A- AGC_T.GG_AGC CGT AG C TTA GCA ACG CTG GCG GAA GAT GCG 12 04^ 

Gin Ala Glu Ser Trp Ser Arg Ser Leu Ala Thr Leu Ala Glu Asp Ala 

300 305 310 

CTG GCG AAA CGT CCC GGC TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC 12 52 

Leu Ala Lys Arg Pro Gly Phe Arg Ser Phe Arg Cys Gin Asp Ser Ser 
315 320 325 
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CTG CTG GCC TTT GAT TTT GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG 13 00 
Leu Leu Ala Phe Asp Phe Ala Gly Val His His Ser Asp Met Val Thr 
330 335 340 

CTG CTG GCG GAG TAC GGT ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT 13 4 8 
Leu Leu Ala Glu Tyr Gly lie Ala Leu Arg Ala Gly Gin His Cys Ala 
345 350 355 

CAG CCG CTA CTG GCA GAA TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT 1396 
Gin Pro Leu Leu Ala Glu Leu Gly Val Thr Gly Thr Leu Arg Ala Ser 
360 365 370 375 

TTT GCG CCA TAT AAT ACA AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC 14 4 4 
Phe Ala Pro Tyr Asn Thr Lys Ser Asp Val Asp Ala Leu Val Asn Ala 

380 385 390 

GTT GAC CGC GCG CTG GAA TTA TTG GTG GAT TAAACGCGTG CTAGAGGCAT 14 94 
Val Asp Arg Ala Leu Glu Leu Leu Val Asp 
395 400 

CAAATAAAAC GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG TTGTTTGTCG 15 54 

GTGAACGCTC TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT ATATTCCGCT 1614 

TCCTCGCTCA CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA AATGGCTTAC 1674 

GAACGGGGCG • GAGATTTCCT GGAAGATGCC AGGAAGATAC TTAACAGGGA AGTGAGAGGG 17 34 

CCGCGGCAAA GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC GAAATCTGAC 1794 

GCTCAAATCA GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG 18 54 

GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC ATTCCGCTGT 1914 

TATGGCCGCG TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC AGTTCGCTCC 19 7 4 

AAGCTGGACT GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT ATC CGGTAAC 2034 

TATC GTCTTG AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC AGCCACTGGT 2094 

AATTGATTTA GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC 2154 

AAGTTTTGGT GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT TGGTAGCTCA 2214 

GAGAACCTTC GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC AAGAGATTAC 22 74 

GCGCAGACCA AAACGATCTC AAGAAGATCA TCTTATTAAT CAGATAAAAT ATTTCTAGAT 2 3 34 

TTCAGTGCAA TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC GATATAAGTT 2394 

GTTACTAGTG CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA GCGTTCTGAA 24 54 

CAAATCCAGA TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC CAAGCGAGCT 2 514 

CTCGAACCCC AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA GGCGATGCGC 2 57 4 
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fpp p* p» a a Trrr^ 


f^APPGGCGAT 


ACCGTAAAGC 


ACGAGGAAGC 


GGTCAGCCCA 


TTCGCCGCCA 


2634 




P A ATATCACG 


GGTAGCCAAC 


GCTATGTCCT 


GATAGCGGTC 


CGCCACACCC 


2694 


a t~* r* c C* C~* A P 


APTPGA/rGAA 


TCCAGAAAAG 


CGGCCATTTT 


CCACCATGAT 


ATTCGGCAAG 


2754 


/-« 7\ /"*P* P* A Tip P* P 




GACGAGATCC 


TCGCCGTCGG 


GCATGCGCGC 


CTTGAGCCTG 


2814 


GCGAAv-Ab 1 l 




GAGCCCCTGA 


TGCTCTTCGT 


CCAGATCATC 


CTGATCGACA 


2874 




PPATPPPAPT 


ACGTGCTCGC 


TC GATG CG AT 


GTTTCGCTTG 


GTGGTCGAAT 


2934 




PPPPATP AAG 


CGTATGCAGC 


CGCCGCATTG 


CATCAGCCAT 


GAT GG AT ACT 


2994 


imm iprnnP P* P* A p" 

TT C T C Vjt La U A vj 


P APPA AnnTR 


AGATGACAGG 


AGATCCTGCC 


CCGGCACTTC 


GCCCAATAGC 


3054 


AGCCAG Iv-LL 


1 XV— 


AGTGACAACG 


TCGAGCACAG 


CTGCGCAAGG 


AACGCCCGTC 


3114 


GTGGCCA(ji-(- 




CGCTGCCTCG 


TCCTGCAGTT 


CATTCAGGGC 


ACC GG AC AGG 


3174 


TCGGTC 1 1 UA 


P A A A A APAAP 


CGGGCGCCCC 


TGCGCTGACA 


GCCGGAACAC 


GGCGGCATCA 


3234 


GAGCAGCCGA 


TTGTCTGTTG 


TGCCCAGTCA 


TAGCCGAATA 


r* f^r~* mp» rnpp a P* 


p^a arrr^rr 

L. v_ AA Lj V- vj o v_ v_ 


J £t Zf *± 


GGAGAACCTG 


CGTGCAATCC 


ATCTTGTTCA 


ATCATGCGAA 


ACGATCCTCA 


TCCTGTCTCT 


3354 


TGATCAGATC 


TTGATCCCCT 


GCGCCATCAG 


ATCCTTGGCG 


GCAAGAAAGC 


CATCCAGTTT 


. 3414 


ACTTTGCAGG 


GCTTCCCAAC 


CTTACCAGAG 


GGCGCCCCAG 


CTGGCAATTC 


C 


t 34 6 5 



(2) INFORMATION ZU SEQ ID NO: 10: 

(i) SEQUENZ CRARAKTERI STIKA : 

(A) LANGE : 401 Aminosauren 

(B) ART: Aminosaure 
(D) T0P0L0GIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHRE IBUNG : SEQ ID NO: 10: 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
l 5 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

-Gl.u-A.l_ci_val _Val Glu Ala Thr Gin G in Phe Tyr Ser Leu Ser Ala Gly 
35 4 0 45 

Asn val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 7.5 80 
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Asp Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser lie Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 110 

He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 

165 170 175 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 

325 330 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 
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Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 

370 375 380 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Giu Leu Leu Val 
385 390 395 400 

Asp 

(2) INFORMATION ZU SEQ ID NO: 11: 

(i) SEQUENZ CHARAKTERISTIKA : 

(A) LANGE: 3481 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(iii) HYPOTHETISCH: NEIN 

(iii) ANTI SENSE : NEIN 

(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: pHS2bioS2 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 279. .1493 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG TATCACGAGG 60 

CCCTTTCGTC TTCACCTCGA GTCCCTATCA GTGATAGAGA TTGACATCCC TATCAGTGAT 120 

AGAG AT AC TG AGCACATCAG CAGGACGCAC TGACCGAATT CATTAAAGAG GAGAAAGGTA 180 

CCGGGCCCCC CCTCGAGGTC GACGGTATCG ATAAGCTTGA TATCGAATTC GTGCAGCCCG 240 

GGGGATCCCA TGGTACGCGT AAAGAGGAGA AATTAACT ATG AAA TTA CCG ATT 2 93 

Met Lys Leu Pro lie 
1 5 

TAT CTC GAC TAC TCC GCA ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG 341 
Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp Pro Arg Val Ala Glu 

— — 10 15 20 

AAA ATG ATG CAG TTT ATG ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC 3 89 

Lys Met Met Gin Phe Met Thr Met Asp Gly Thr Phe Gly Asn Pro Ala 
25 30 35 
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TCC CGT TCT CAC CGT TTC GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC 4 37 

Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu Glu Ala Val Asp lie 

40 45 50 

GCC CGT AAT CAG ATT GCC GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC 4 85 

Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala Asp Pro Arg Glu lie 
55 60 65 

GTC TTT ACC TCT GGT GCA ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT 533 
Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn Leu Ala He Lys Gly 
70 75 80 85 

GCA GCC AAC TTT TAT CAG AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA 5 81 

Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His He He Thr Ser Lys 

90 95 100 

ACC GAA CAC AAA GCG GTA CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA 6 29 

Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg Gin Leu Glu Arg Glu 
105 110 115 

GGT TTT GAA GTC ACC TAC CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC 67 7 

Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg Asn Gly He He Asp 
120 125 130 

CTG AAA GAA CTT GAA GCA GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC 72 5 

Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp Thr lie Leu Val Ser 
135 140 145 

ATC ATG CAC GTA AAT AAC GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT 773 
lie Met His Val Asn Asn Glu He Gly Val Val Gin Asp He Ala Ala 
150 155 160 165 

ATC GGC GAA ATG TGC CGT GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA 821 
He Gly Glu Met Cys Arg Ala Arg Gly He He Tyr His Val Asp Ala 

170 175 180 

ACC CAG AGC GTG GGT AAA CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT 869 
Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu Ser Gin Leu Lys Val 
185 190 195 

GAC CTG ATG TCT TTC TCC GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC 917 
Asp Leu Met Ser Phe Ser Gly His Lys He Tyr Gly Pro Lys Gly He 
200 205 210 

GGT GCG CTG TAT GTA CGT CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA 9 65 

Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val Arg He Glu Ala Gin 
215 220 225 

ATG CAC GGC GGC GGT CAC GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT 1013 
Met His Gly Gly Gly His Glu Arg Gly Met Arg Ser Gly Thr Leu Pro 
230 235 240 245 
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GTT CAC CAG ATC GTC GGA ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA 1061 
Val His Gin lie Val Gly Met Gly Glu Ala Tyr Arg lie Ala Lys Glu 

250 255 260 

GAG ATG GCG ACC GAG ATG GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG 1109 
Glu Met Ala Thr Glu Met. Glu Arg Leu Arg Gly Leu Arg Asn Arg Leu 
265 270 275 

TGG AAC GGC ATC AAA GAT ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG 1157 
Trp Asn Gly He Lys Asp He Glu Glu Val Tyr Leu Asn Gly Asp Leu 
280 285 290 

GAA CAC GGT GCG CCG AAC ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA 12 05 

Glu His Gly Ala Pro Asn lie Leu Asn Val Ser Phe Asn Tyr Val Glu 
295 300 305 

GGT GAG TCG CTG ATT ATG GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT 12 53 

Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu Ala Val Ser Ser Gly 
310 315 320 325 

TCC GCC TGT ACG TCA GCA AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG 13 01 

Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala 
330 335 340 

CTG GGG CTG AAC GAC GAG CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA 1349 
Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser He Arg Phe Ser Leu 
345 350 355 

GGT CGT TTT ACT ACT GAA GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT 13 97 

Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr Thr He Glu Leu Val 
360 365 370 

CGT AAA TCC ATC GGT CGT CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG 14 4 5 

Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser Pro Leu Trp Glu Met 
375 380 385 

TAC AAG CAG GGC GTG GAT CTG AAC AGC ATC GAA TGG GCT CAT CAT TAAACGCGTG 1500 
Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu Trp Ala His His 
390 395 400 405 

CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG 1560 

TTGTTTGTCG GTGAACGCTC TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT 16 20 

ATATTCCGCT TCCTCGCTCA CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA 1680 



AATGGCTTAC GAACGGGGCG GAGATTTCCT -GGAAGATGCC AGGAAGATAC TTAACAGGGA 174 0 

AGTGAGAGGG CCGCGGCAAA GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC 18 00 

GAAATCTGAC GCTCAAATCA GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG 1860 

TTTCCCCCTG GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC 19 20 
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ATTCCGCTGT TATGGCCGCG TTTCTCTCAT* TCCACGCCTG ACACTCAGTT CCGGGTAGGC 19 80 

AGTTCGCTCC AAGCTGGACT GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT 2 04 0 

ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGAAAGACAT GCAAAAGCAC C AC TG GC AG C 2100 

AGCCACTGGT AATTGATTTA GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT T AAGG C T AAA 216 0 

CTGAAAGGAC AAGTTTTGGT GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT 22 20 

TGGTAGCTCA GAGAACCTTC GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC 22 80 

AAGAGATTAC GCGCAGACCA AAACGATCTC AAGAAGATCA TCTTATTAAT CAGATAAAAT 234 0 

AT TT C TAG AT TTCAGTGCAA TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC 24 00 

GATATAAGTT GTTACTAGTG CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA 2460 

GCGTTCTGAA CAAATCCAGA TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC 2 52 0 

CAAGCGAGCT CTCGAACCCC AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA 2 580 

GGCGATGCGC TGCGAATCGG GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA 26 4 0 

TTCGCCGCCA AGCTCTTCAG CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC 27 00 

CGCCACACCC AGCCGGCCAC AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT 27 60 

ATTC GGCAAG CAGGCATCGC CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC 282 0 

CTTGAGCCTG GCGAACAGTT CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CGAGATCATC 2 880 

CTGATCGACA AGACCGGCTT CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG 29 4 0 

GTGGTCGAAT GGGCAGGTAG CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT 3 000 

GATGGATACT TTCTCGGCAG GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC 3 06 0 

GCCCAATAGC AGCCAGTCCC TTCCCGCTTC AGTGACAACG TCGAGCACAG CTGCGCAAGG 312 0 

AACGCCCGTC GTGGCCAGCC ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC 3180 

ACCGGACAGG TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC 32 4 0 

GGCGGCATCA GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC 3 3 00 

CCAAGCGGCC GGAGAACCTG CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA 33 60 

TCCTGTCTCT TGATCAGATC TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC 34 2 0 

CATCCAGTTT ACTTTGCAGG GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC 3 4 80 

c 3481 

(2) INFORMATION ZU SEQ ID NO: 12: 
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(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 404 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Met Lys Leu Pro He Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 
1 5 10 15 

Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 1 40 45 

Glu Ala Val Asp He Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala 
50 55 60 

Asp Pro Arg Glu He Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

Leu Ala lie Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 

He He Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 110 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly He He Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

Thr He Leu Val Ser He Met His Val Asn Asn Glu He Gly Val Val 
14 5 150 15-5 160 . 

Gin Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly He He 

165 170 175 

Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro lie Asp Leu 
180 185 190 

Se r Gin Le u Lys Val Asp Leu Met Ser Phe Ser Gly His Lys lie Tyr 



195 200 20"5 



Gly Pro Lys Gly lie Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 

210 215 220 

Arg lie Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 

225 230 235 240 
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Ser Gly Thr Leu Pro Val His Gin lie Val Gly Met Gly Glu Ala Tyr 

245 250 255 

Arg lie Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

Leu Arg Asn Arg Leu Trp Asn Gly lie Lys Asp lie Glu Glu Val Tyr 
275 280 285 

Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn lie Leu Asn Val Ser 
290 295 300 

Phe Asn Tyr Val Glu Gly Glu Ser Leu lie Met Ala Leu Lys Asp Leu 
305 310 315 320 

Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 

325 330 335 

Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

lie Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu lie Asp Tyr 
355 360 365 

Thr lie Glu Leu Val Arg Lys Ser lie Gly Arg Leu Arg Asp Leu Ser 
370 375 380 

Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser lie Glu 
385 390 395 400 

Trp Ala His His 
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